用 7 行代码在本地运行 Llama 2！（苹果silicon-mac m1 m2）

业界资讯 2023-07-21 06:06:45 阅读次数: 0

在这里插入图片描述
总而言之：

xcode-select --install # Make sure git & clang are installed
git clone https://github.com/ggerganov/llama.cpp.git
cd llama.cpp
curl -L https://huggingface.co/TheBloke/Llama-2-7B-Chat-GGML/resolve/main/llama-2-7b-chat.ggmlv3.q4_K_M.bin --output ./models/llama-2-7b-chat.ggmlv3.q4_K_M.bin 
LLAMA_METAL=1 make
./main -m ./models/llama-2-7b-chat.ggmlv3.q4_K_M.bin -n 1024 -ngl 1 -p "Give me a list of things to do in NYC"

注意：7B 型号重量约为 4GB，请确保您的机器上有足够的空间。

这是在做什么？

这是使用 Georgi Gerganov 令人惊叹的llama.cpp项目来运行 Llama 2。它通过TheBloke的 Huggingface 存储库为 Llama 7B Chat 下载一组 4 位优化的权重，将其放入 llama.cpp 中的模型目录中，然后使用 Apple 的 Metal 优化构建 llama.cpp。

这允许您以最少的工作在本地运行 Llama 2。7B 权重应该适用于具有 8GB RAM 的机器（如果您有 16GB 则更好）。13B 或 70B 等较大型号将需要更多的 RAM。

请注意，Llama 2

猜你喜欢

转载自blog.csdn.net/iCloudEnd/article/details/131843889

用 7 行代码在本地运行 Llama 2！（苹果silicon-mac m1 m2）

M2 Ultra 可并行运行 128 个 Llama2-7B 流

在 Mac M1 上运行 Llama 2 并进行训练

在m1/m2芯片的mac电脑上运行Stable Diffusion的全步骤

Mac(M1/M2)通过wine运行windows程序

M0、M1 和 M2

Apple Silicon M1是什么？如何在m1上运行Rosetta2通用软件？

【转帖】M1、M2增速

Netgear Nighthawk M2 VS M1

苹果mac m1,m2芯片安装 pytorch和tensorflow的GPU版本

M0 M1 M2 M3

如何在 Apple Silicon M1/M2 中并行安装 MS SQL？

Mac M系列芯片（M1/M2）安装Docker

Mac M系列芯片（M1/M2）Docker安装Postgres数据库

Mac M系列芯片（M1/M2）Docker安装Zookeeper并持久化数据

mac .m2

一文搞懂经济数据中M0 M1 M2

货币供应量——M0、M1、M2

什么是社会融资规模，M0、M1、M2？

苹果macOS系统M1、M2芯片关闭sip的方法

在苹果 macOS m1和m2 使用 MATLAB分步指南

macOS苹果系统m1 m2芯片安装Java JDK 教程

mac m1 m2 深度学习环境（pytorch）配置

在arm架构的mac上安装sql server（m1芯片 or m2芯片）

mac m1,m2 安装提供GPU支持的pytorch和tensorflow

M1、M2芯片Mac安装虚拟机

M1/M2 Mac电脑无法打开游戏怎么办

Mac M1/M2 安装nvm管理多版本node

mac m1/m2 芯片安装 ps 2023 插件无法显示扩展界面

Mac M1/M2芯片电脑问题解决汇总

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

周排行

Python环境安装与基础语法（1）——计算机基础知识

IMU预积分

ADAS中的LDW、FCW、BSD、LCA、ACC、AEB、APA、DMS代表的含义

B站笔试两道题

skyeye arm 硬件虚拟机环境的搭建

Web前端静态页面示例

数组-合并排序数组 II-简单

springcloud之版本问题启动报错

面向对象-------------匿名对象(六)

输入URL到页面呈现中间发生了什么？

每日归档

更多

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)