使用 LangChain4j 构建本地 RAG 系统

1、引言

由于目前比较火的 chatGPT 是预训练模型,而训练一个大模型是需要较长时间(参数越多学习时间越长,保守估计一般是几个月,不差钱的可以多用点 GPU 缩短这个时间),这就导致了它所学习的知识不会是最新的,最新的 chatGPT-4o 只能基于 2023 年 6 月之前的数据进行回答,距离目前已经快一年的时间,如果想让 GPT 基于近一年的时间回复问题,就需要 RAG(检索增强生成)技术了。

此外,对于公司内部的私有数据,为了数据安全、商业利益考虑,不能放到互联网上的数据,因此 GPT 也没有这部分的知识,如果需要 GPT 基于这部分私有的知识进行回答,也需要使用 RAG 技术。

本文将通过实战代码示例,意在帮助没有大模型实战经验的 Java 工程师掌握使用 LangChain4j 框架进行大模型开发。

2、基本概念

2.1 什么是 RAG

RAG(Retrieval-Augmented Generation)的核心思想是:

猜你喜欢

转载自blog.csdn.net/leread/article/details/147040993
今日推荐