深度学习-146-大语言模型LLM之大模型的一些基本概念梳理 - 代码天地

深度学习-146-大语言模型LLM之大模型的一些基本概念梳理

企业开发 2025-04-08 08:08:09 阅读次数: 0

文章目录

1 大模型优化的三个途径
2 deepseek模型兼容性检测工具
3 Tokens究竟是什么
4 大模型的三种模式
5 vLLM和Ollama
- 5.1 vLLM(超大型语言模型)
- 5.2 Ollama
6 参考附录

1 大模型优化的三个途径

这三种方法，都是优化的大模型的手段，但是实现路径和应用场景不同。

1.1 蒸馏

蒸馏：是学生通过模仿老师的解题思路，达到和老师相似的知识水平。
适用于将大模型的能力迁移到小模型上，以适配更低端的算力环境。
比如在企业私有云、个人电脑甚至手机、边缘终端上。
在这里插入图片描述

1.2 微调

微调：又叫精调，相当于学生意识到自己某门课有短板，然后自己找参考书恶补了一下，从而补上短板。
适用于特定场景下，用特定数据集对通用模型进行小规模训练。
比如通用基础模型对医疗不大懂，就用医疗数据集给它开小灶，让他变身医疗专家模型。
在这里插入图片描述

1.3 RAG

RAG：直译过来叫做“检索增强生成”。相当于这题我不会，但是我有

猜你喜欢

转载自blog.csdn.net/qq_20466211/article/details/145604642

深度学习-146-大语言模型LLM之大模型的一些基本概念梳理

深度学习-147-大语言模型LLM之大模型的一些基本工作原理

一些基本概念的梳理

深度学习的一些基本概念-CNN（1）

学习深度学习--深度学习中的一些基本概念

语言模型的基本概念

大语言模型：LLM的概念是个啥？

大语言模型(LLM) 参数量概念

我的AI进坑之路---深度学习和机器学习的一些基本概念

深度学习中的正则化：你必须了解的一些基本概念

深度学习中的一些基本概念--帮助自己更好的理解和更改网络

深度学习的一些基本概念—入门教程

C语言中的一些基本概念

从零学习大模型（十）-----剪枝基本概念

一、机器学习一些基本概念

大语言模型LLM

LLM：大语言模型

机器学习中的一些基本概念

学习笔记 Keras:一些基本概念

OpenCV学习中遇到的一些基本概念

大语言模型(LLM)综述(一)：大语言模型介绍

【转】语言模型的基本概念

http的一些基本概念

elasticsearch的一些基本概念

Oracle一些基本概念

MongoDB 一些基本概念

Thread一些基本概念

Java的一些基本概念

TensorFlow的一些基本概念

一些基本概念的区分

今日推荐

Electron中的关于静态资源加载问题解决方案

《Cursor-AI编程》基础篇-界面指南

《Cursor-AI编程》基础篇-Tab代码智能补充

《Cursor-AI编程》基础篇-Composer功能详解

《Cursor-AI编程》基础篇-Chat功能详解

《Cursor-AI编程》进阶篇-自定义模型

《Cursor-AI编程》进阶篇-上下文详解

【大模型系列篇】最强检索增强技术GraphRAG基本原理详解

【大模型系列篇】基于Ollama和GraphRAG v2.0.0快速构建知识图谱

解释什么是迁移学习？在 CNN 中如何应用？（面试题200合集，高频、关键）

解释数据增强（Data Augmentation）的概念和方法（（面试题200合集，高频、关键））

揭秘大模型“魔法”：Function Calling 让 AI 不止会说，更能“做”！

周排行

ConfigurationClassParser类的parse方法源码解析

基础大讲堂-java 位运算符

ConsecutiveInteger判断给定的整数n能否表示成连续的m(m>1)个正整数之和

多项式问题之六——多项式快速幂

Spring Security技术栈开发企业级认证与授权（四）RESTful API服务异常处理

Linux基础命令---apachectl

MATLAB中的线性插值

Unity编辑器拓展之十七：NGUI ComponentSelector增加搜索框

SqlServer 备份还原教程

[Unity动画]01.

每日归档

更多

2025-04-12(10529)

2025-04-11(9561)

2025-04-10(1213)

2025-04-09(10354)

2025-04-08(12998)

2025-04-07(0)

2025-04-06(0)

2025-04-05(0)

2025-04-04(0)

2025-04-03(0)