前两篇文章,启动了dify服务,配置了大模型参数并完成了与大模型的 衔接。本篇简要讲解如何搭建知识库。
真正在应用时,可以对dify进行二次开发,实现企业知识库、部门知识库、个人知识库等多种类型的知识库,并配置相应的权限,防止企业重要信息泄露。
一、准备工作
- 启动xinference服务,并运行模型;(参见:Windows10上部署DeepSeek+RAG知识库操作详解(Dify方式)之1)
- 启动dify服务;(参见:Windows10上部署DeepSeek+RAG知识库操作详解(Dify方式)之2)
二、创建知识库
选择数据源时有三种方式,一般我们都是用企业内部或者自己的文档来生成知识库。
这里举例,随便选择书籍,可以一次性选多个文件,dify限制是单次文件不超过15M即可。
索引方式可以选择经济,也可以用高质量(需要配置对应的大模型类型),其它参数可以默认。
等待文档转成知识库
重回知识库首页,我们可以看到已经建好的知识库
点击它,我们还可以不断的对它增加文件,完善知识库内容。
三、使用知识库
到之前创建的一个聊天工具中
进入聊天助手,添加刚刚新建的知识库
对话测试,回答内容已经引用了知识库的内容。
这整个过程是:
通过对聊天助手提问,它从知识库获取相应的知识点,组合成新的提示词,给到大模型,再得到大模型的输出。如果是对内容要求比较严格的规章制度,经过大模型加工后的输出,有可能偏离初衷。所以需要在系统指令上添加合适的约束,让大模型不要发散。
具体操作:在聊天助手添加完知识库之后,设置它的相关参数:
以下参数可以根据需要进行调整