llama2前脚刚开源我后脚就试试搭建70B - 代码天地

llama2前脚刚开源我后脚就试试搭建70B

企业开发 2023-08-01 19:49:14 阅读次数: 0

1 申请下载模型权限

https://ai.meta.com/resources/models-and-libraries/llama-downloads/

稍微认证填一填，我这次大概10分钟左右给我通过了

邮件内容如下：

2 下载llama源码

git clone [email protected]:facebookresearch/llama.git

3 下载模型

使用源码里面的download.sh进行下载

如下图

第一步让你输入邮件里面那个授权url，很长，https://download.llamameta.net开头

第二步让你输入想要下载的模型名称，这里下载的是70B-chat

之后会下载几个LICENSE和tokenizer.model等

再之后就是我们最需要的模型文件了。如下图

4 下载花絮

2023-7-22 11:20:30，开始下载的时候是2023-7-21 17:30，过去这么久，下载了不少模型了，但是刚刚发现报错了。。。。

不知道能不能继续

然后重新执行download.sh脚本，发现会重新下载已经下载过的模型，ε=(´ο｀*)))唉！！！！

只能改下源码，跳过已经下载过的。

我这里原本下载好了00 01 02 03 04 05 06，07也有，由于07是最后一个，不确定下载完成没，所以也当做没下载，另外00在我重试download.sh脚本的时候覆盖了，也是不完整的，所以我把download.sh脚本改为如下图

if [[ $s != "01" && $s != "02" && $s != "03" && $s != "04" && $s != "05" && $s != "06" ]]

wget xxxx

fi

2023-7-22 14:50:21总算下载完成

模型大概129G

5 跑官方demo

2023-7-24 22:10

官方说了这里需要8个MP，所以我跑的时候指定了8个GPU

CUDA_VISIBLE_DEVICES=1,2,3,4,6,7,8,9 torchrun --nproc_per_node 8 --master_port=29501 example_chat_completion.py --ckpt_dir llama-2-70b-chat/ --tokenizer_path tokenizer.model --max_seq_len 512 --max_batch_size 4

启动命令后，查看GPU状态，如下图

查看终端输出

很顺利的运行了！

6 微调

后续补充

猜你喜欢

转载自blog.csdn.net/wade1010/article/details/131857538

llama2前脚刚开源我后脚就试试搭建70B

使用ExLlamaV2在消费级GPU上运行Llama2 70B

Meta开源Code Llama 70B,缩小与GPT-4之间的技术鸿沟

【AI实战】开源中文 llama2 来了，30 分钟搭建 130 亿参数大模型 Llama2-Chinese-13b-Chat

基于Llama2模型的开源模型

LLaMa2

Llama2~baby

Llama2技术细节&开源影响

阿里云通义千问14B模型开源！性能超越Llama2等同等尺寸模型

Firefly-LLaMA2-Chinese - 开源中文LLaMA2大模型

国内最大Llama开源社区发布首个预训练中文版Llama2

llama2模型下载

Baichuan2开源大模型正式发布，王小川：性能超过LLaMA2

LLMs之LLaMA2：LLaMA2的简介(技术细节)、安装、使用方法(开源-免费用于研究和商业用途)之详细攻略

使用 Docker 快速上手中文版 LLaMA2 开源大模型

使用 Docker 快速上手官方版 LLaMA2 开源大模型

Llama2开源大模型的新篇章以及在阿里云的实践

如何让 Llama2、通义千问开源大语言模型快速跑在函数计算上？

Llama2 指令精调脚本

[NLP]llama2模型下载地址

使用DPO微调Llama2

打起来了~ 最小SOTA模型：Mistral 7B，各方面碾压LLaMA2 13B和LLaMA1 34B

度小满“轩辕70B”金融大模型开源！登顶两大权威测评榜单，所有用户均可下载...

开源第一！元象国产大模型在权威评测超越Llama2和百川

一文就懂大语言模型Llama2 7B+中文alpace模型本地部署

千亿大模型开源共训，打造中国的LLAMA70B

我从在 Ubuntu Linux 上的传统 CPU 架构上尝试运行 Llama2 中学到了什么

Meta 的新 Llama2 发布让您兴奋不已

关于中文LLaMA2的一些不错的工作

“伶荔”(Linly) 项目发布中文LLaMA2模型

今日推荐

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

周排行

计算机组成与设计（七）—— 除法器

Integer Approximation(分治+枚举)

大话数据库索引

windows10系统JDK的配置及下载地址

mysql实现秒值转换中原六仔平台搭建

Codeforces Round #556 (Div. 1)

百练1064 网线主管

Codeforces 995F Cowmpany Cowmpensation

子集生成之增量构造法，位向量法，二进制法

ERROR: cmd.exe failed with args /c "/APK\gradle\rungradle.bat...

每日归档

更多

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)