LLaMA Factory对大模型微调和导出量化操作 - 代码天地

LLaMA Factory对大模型微调和导出量化操作

企业开发 2025-04-11 22:38:11 阅读次数: 0

LLaMA Factory 是一个简单易用且高效的大型语言模型（Large Language Model）训练与微调平台。通过 LLaMA Factory，可以在无需编写任何代码的前提下，在本地完成上百种预训练模型的微调，框架特性包括：

模型种类：LLaMA、LLaVA、Mistral、Mixtral-MoE、Qwen、Yi、Gemma、Baichuan、ChatGLM、Phi 等等。
训练算法：（增量）预训练、（多模态）指令监督微调、奖励模型训练、PPO 训练、DPO 训练、KTO 训练、ORPO 训练等等。
运算精度：16 比特全参数微调、冻结微调、LoRA 微调和基于 AQLM/AWQ/GPTQ/LLM.int8/HQQ/EETQ 的 2/3/4/5/6/8 比特 QLoRA 微调。
优化算法：GaLore、BAdam、DoRA、LongLoRA、LLaMA Pro、Mixture-of-Depths、LoRA+、LoftQ 和 PiSSA。
加速算子：FlashAttention-2 和 Unsloth。
推理引擎：Transformers 和 vLLM。
实验监控：LlamaBoard、TensorBoard、Wandb、MLflow、SwanLab 等等。

github地址：https://github.com/hiyouga/LLaMA-Factory

官方文档：https://llamafactory.readthedocs.io/zh-cn/latest/

一、安装LLaMA Factory

将源码下载到本地,cd到根目录进行安装。（可全程在VSCode编辑器的控制台进行操作）

conda create -n llamafactory python=3.10 -y
conda activate llamafactory

猜你喜欢

转载自blog.csdn.net/puzi0315/article/details/146430880

LLaMA Factory对大模型微调和导出量化操作

【大模型】LLaMA-Factory的环境配置、微调模型与测试

在阿里云上用LLaMA-Factory微调大模型

【微调大模型】轻松微调百余种大模型：LLaMA-Factory

【微调大模型】使用LLaMA-Factory进行监督微调 Qwen2.5

基于peft 微调 LLaMa模型

多模态大模型微调实践！PAI+LLaMA Factory搭建AI导游

LLaMA Factory微调后的大模型在vLLM框架中对齐对话模版

LLaMA模型系统解读

精调llama模型

LLaMA系列模型

LLaMA

大模型之Bloom&LLAMA----SFT(模型微调)

使用 DPO 微调 Llama 2

LLaMA Factory 核心原理讲解

LORA+llama模型微调全流程

训练自己的Llama 2！大模型微调技术介绍

LLaMA-Factory大模型训练框架相关参数解释

使用LLaMA-Factory快速训练自己的专用大模型

基于中文金融知识的 LLaMA 系微调模型的智能问答系统：LLaMA大模型训练微调推理等详细教学

LLaMA的解读与其微调：Alpaca-LoRA/Vicuna/BELLE/中文LLaMA/姜子牙/LLaMA 2

【DeepSeek+LLaMA-Factory+Lora+FastAPI】开发人员如何微调大模型并暴露接口给后端调用（理论）

Llama 系列简介与 Llama3 预训练模型推理

LLaMA及其子孙模型概述

llama2模型下载

AI | LLaMA-Factory 一个好用的微调工具

打造生产级Llama大模型服务

LLAMA预训练：大模型的潜力与挑战

大模型——VLLM 运行llama4

[AI 大模型] Meta LLaMA-2

今日推荐

Electron中的关于静态资源加载问题解决方案

《Cursor-AI编程》基础篇-界面指南

《Cursor-AI编程》基础篇-Tab代码智能补充

《Cursor-AI编程》基础篇-Composer功能详解

《Cursor-AI编程》基础篇-Chat功能详解

《Cursor-AI编程》进阶篇-自定义模型

《Cursor-AI编程》进阶篇-上下文详解

【大模型系列篇】最强检索增强技术GraphRAG基本原理详解

【大模型系列篇】基于Ollama和GraphRAG v2.0.0快速构建知识图谱

解释什么是迁移学习？在 CNN 中如何应用？（面试题200合集，高频、关键）

解释数据增强（Data Augmentation）的概念和方法（（面试题200合集，高频、关键））

揭秘大模型“魔法”：Function Calling 让 AI 不止会说，更能“做”！

周排行

ConfigurationClassParser类的parse方法源码解析

基础大讲堂-java 位运算符

ConsecutiveInteger判断给定的整数n能否表示成连续的m(m>1)个正整数之和

多项式问题之六——多项式快速幂

Spring Security技术栈开发企业级认证与授权（四）RESTful API服务异常处理

Linux基础命令---apachectl

MATLAB中的线性插值

Unity编辑器拓展之十七：NGUI ComponentSelector增加搜索框

SqlServer 备份还原教程

[Unity动画]01.

每日归档

更多

2025-04-12(10529)

2025-04-11(9561)

2025-04-10(1213)

2025-04-09(10354)

2025-04-08(12998)

2025-04-07(0)

2025-04-06(0)

2025-04-05(0)

2025-04-04(0)

2025-04-03(0)