通俗易懂解读AI 大模型概念（二）Transformer、RAG、AI Agent、模型微调

企业开发 2025-04-08 12:38:25 阅读次数: 0

一、Transformer 是什么？

早些年，深度学习用到的方法是卷积神经网络（CNN）和循环神经网络（RNN）。

2017 年，谷歌的研究人员发明了一种新的深度学习处理方法，叫做 Transformer（转换器）。

Transformer 不同于以前的方法，不再一个个处理输入的单词，而是一次性处理整个输入，对每个词分配不同的权重。

这种方法直接导致了 2022 年 ChatGPT 和后来无数生成式 AI 模型的诞生，是神经网络和深度学习目前的主流方法。

由于基于 Transformer 的模型需要一次性处理整个输入，所以都有"上下文大小"这个指标，指的是一次可以处理的最大输入。

比如，GPT-4 Turbo 的上下文是 128k 个 Token，相当于一次性读取超过 300 页的文本。上下文越大，模型能够考虑的信息就越多，生成的回答也就越相关和连贯，相应地，所需要的算力也就越多。

二、什么是 RAG？

RAG（Retrieval Augmented Generation检索增强生成）是一种让 AI 模型变得更"博学"的方法。想象你在写一篇论文，除了用自己的知识，还会去查阅参考资料。RAG 就是给 AI 配备了一个"资料库"和"检索系统"。

当 AI 需要回答问题时，会先从资料库中检索相关信息，再结合这些信息来生成答案。这样做有几个好处：

可以获取最新信息，克服模型训练数据落后的问题；
能提供更准确的回答，因为有具体的参考依据；
可以处理特定领域的专业问题，比如公司内部知识；

三、什么是 AI Agent？

AI Agent（智能代理）可以理解为一个能自主完成任务的 AI 助手。它不只是简单地回答问题，而是能够：

理解用户的长期目标；
制定实现目标的计划；
自主选择合适的工具；
执行必要的操作；
根据执行结果调整计划；

打个比方：

普通的 AI 模型就像一个知识渊博的顾问，你问什么答什么
AI Agent 则像一个能干的助理，你交代一个目标，它就能规划步骤并付诸行动
比如你说"帮我订一张下周去北京的机票"，它会自动查询航班信息、比较价格、考虑你的日程安排，最后完成订票。

这两项技术代表了 AI 发展的重要方向：

RAG 让 AI 变得更懂更准；
Agent 让 AI 变得更能干更自主；

这些技术正在快速发展，未来可能会让 AI 助手变得更像我们的"得力助手"，而不仅仅是一个问答工具。

四、什么是模型微调？

模型微调（Fine-tuning） 是一种常用的迁移学习（Transfer Learning）技术，用于在已有预训练模型的基础上，针对特定任务进行少量的训练，以适应新的数据集或任务。通过微调，模型能够在保留大部分从预训练中学到的知识的同时，快速适应新的任务需求。

基本思想：模型微调的核心思想是利用在大规模数据集（如 ImageNet、COCO、BERT 等）上预训练的模型，并在新任务中对其进行再训练（即“微调”），使其在特定任务上达到最佳性能。这种方法通常不需要从零开始训练模型，可以显著减少计算资源的需求，并且由于预训练模型已经学习到很多通用的特征，它能在新任务上迅速收敛。

用学习钢琴的例子来解释模型微调：想象你已经学会了弹钢琴的基本功（这就像预训练模型），会看谱、懂节奏、熟悉键盘。现在你想学一首新歌：

基本功（预训练）：