LLaMA的解读与其微调：Alpaca-LoRA/Vicuna/BELLE/中文LLaMA/姜子牙/LLaMA 2

企业开发 2023-07-28 19:13:24 阅读次数: 0

前言

近期，除了研究ChatGPT背后的各种技术细节不断看论文(至少100篇，100篇目录见此：ChatGPT相关技术必读论文100篇)，还开始研究一系列开源模型(包括各自对应的模型架构、训练方法、训练数据、本地私有化部署、硬件配置要求、微调等细节)

本文一开始是作为此文《ChatGPT技术原理解析：从RL之PPO算法、RLHF到GPT4、instructGPT》的第4部分，但随着研究深入为避免该文篇幅又过长，将把『第4部分开源项目』抽取出来独立成本文，然后不断续写本文直至成了一个系列

毕竟我上半年的目标之一，便是把ChatGPT涉及的所有一切关键技术细节，以及相关的开源项目都研究的透透的，故过程中会不断产出一篇篇新文章、新课程(比如七月类ChatGPT微调实战课)出来

第一部分 LLaMA的代码级解读：RMSNorm/SwiGLU/RoPE/Transformer

1.1 Meta发布LLaMA((7B 13B 33B 65B)&#x

猜你喜欢

转载自blog.csdn.net/u013250861/article/details/131971188

LLaMA的解读与其微调：Alpaca-LoRA/Vicuna/BELLE/中文LLaMA/姜子牙/LLaMA 2

类ChatGPT模型LLaMA的解读与其微调：Alpaca-LoRA/Vicuna/BELLE

使用 DPO 微调 Llama 2

[NLP]使用Alpaca-Lora基于llama模型进行微调教程

Llama-1｜Alpaca-LoRA 微调模型下载以及安装推理教程

使用DPO微调Llama2

微调语言大模型选LoRA还是全参数？基于LLaMA 2深度分析

【LLM模型篇】LLaMA2 | Vicuna | EcomGPT等

NLP之LLMs：《Zeno Chatbot Report》的翻译与解读—CMU副教授详测七款个类ChatGPT大模型(GPT-2、LLaMa、Alpaca、Vicuna、MPT-Chat、Coher

[NLP]LLaMA与LLamMA2解读

LLaMA模型微调版本 Vicuna 和 Stable Vicuna 解读

【类ChatGPT】中文LLaMA-2、Alpaca-2 二代羊驼大模型体验

大语言模型之十五-预训练和监督微调中文LLama-2

LLM系列 | 20 : Llama2 实战(下篇)-中文语料微调(附完整代码)

快速玩转 Llama2！阿里云机器学习 PAI 推出最佳实践（一）——低代码 Lora 微调及部署

LLaMa2

Llama2~baby

LLM - Transformer && LLaMA2 结构分析与 LoRA 详解

训练自己的Llama 2！大模型微调技术介绍

使用QLoRA对Llama 2进行微调的详细笔记

全面对比GPT-3.5与LLaMA 2微调

LLMs：LLaMA Efficient Tuning(一款可高效微调【全参数/LoRA/QLoRA】主流大模型【ChatGLM2/LLaMA2/Baichuan等】的高效工具【预训练+指令监督微调+

类ChatGPT项目的部署与微调(上)：从LLaMA到Alpaca、BELLE

Firefly-LLaMA2-Chinese - 开源中文LLaMA2大模型

足够惊艳，使用Alpaca-Lora基于LLaMA(7B)二十分钟完成微调，效果比肩斯坦福羊驼

国内最大Llama开源社区发布首个预训练中文版Llama2

最强开源大模型？Llama 2论文解读

alpaca-lora微调

LLaMA-v2-Chat 与 Alpaca：什么时候应该使用每种 AI 模型？

Llama 2 团队里的华人

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

基本数据类型封装类比较 Java源码解读(一) 8种基本类型对应的封装类型

JS实现无缝滚动上

深入解析HashMap原理（基于JDK1.8）

mysql的连接池

关于.htc

linux下的ubuntu12.04图形界面

【数论】好推不好记的扩展欧几里德

设备树详解

cscope + tags 简单设置

xml学习

每日归档

更多

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)