大模型基础03：Embedding 实战本地知识问答 - 代码天地

大模型基础03：Embedding 实战本地知识问答

业界资讯 2023-12-17 12:43:48 阅读次数: 0

大模型基础：Embedding 实战本地知识问答

Embedding 概述

在这里插入图片描述
知识在计算机内的表示是人工智能的核心问题。从数据库、互联网到大模型时代，知识的储存方式也发生了变化。在数据库中，知识以结构化的数据形式储存在数据库中，需要机器语言（如SQL）才能调用这些信息。互联网时代，人们调用搜索引擎获取互联网上的非结构化的知识。而对于大语言模型而言，知识以参数的形式储存在模型中，通过自然语言的 Prompt 问答的方式就可以直接调用这些知识。

语言是离散的符合，自然语言的表示学习，就是将人类的语言表示成更易于计算机理解的方式，尤其在深度学习兴起后，如何在网络的输入层更好的进行自然语言表示，成了值得关注的问题。在机器学习中，embedding 是指将高维度的数据（例如文字、图片、音频）映射到低维度空间的过程。Embedding 可以将文本数据映射成一个数值向量形式，而且语义相近的词，在向量空间上具有相似的位置，从而方便计算机进行处理和分析。比如用 Cosine 距离计算相似度；句子中多个词的 Embedding 相加得到句向量。

Embedding 起源于 Word Embedding，经过多年的发展，已取得长足进步。从横向发展来看，由原来单纯的 Word Embedding，发展成现在的Item Embedding、Entity Embedding、Graph Embedding、Position Embedding、Segment Embedding等

猜你喜欢

转载自blog.csdn.net/LifeRiver/article/details/132327478

大模型基础03：Embedding 实战本地知识问答

LLMs：大语言模型技术的最新应用案例技术积累实战阶段性分享与探讨(企业级应用场景，本地知识库问答系统/代码智能生成系统/角色扮演对话聊天系统/与数据库对话问答系统)

基础知识 -- 问答

自然语言处理22-基于本地知识库的快速问答系统，利用大模型的中文训练集为知识库

ERP基础知识问答

监控基础知识问答

JAVA基础知识问答

【大模型】二、大语言模型的基础知识

【大模型知识库】（5）：本地环境运行dity+fastchat的BGE模型，可以使用embedding接口对知识库进行向量化，连调成功。

基于ChatGLM2和langchain的本地知识库问答的实战方案

python 大模型处理的常见问答，知识蒸馏，数据增强，大模型funtuning，大模型训练

知识图谱与智能问答基础理解

机器学习基础知识问答

网络基础知识问答梳理

C#的基础知识问答

iOS签名的基础知识及问答！

软件测试基础知识问答

Java基础知识问答总结

基于大语言模型知识问答应用落地实践 – 知识库构建（上）

基于大语言模型知识问答应用落地实践 – 知识库构建（下）

大数据基础问答03

深度学习实战52-基于医疗大模型与医疗智能诊断问答的运用研究

LLMs之LLaMA2：基于LocalGPT利用LLaMA2模型实现本地化的知识库(Chroma)并与本地文档(基于langchain生成嵌入)进行对话问答图文教程+代码详解之详细攻略

Android webrtc实战（一）录制本地视频并播放，附带详细的基础知识讲解

问答QA（二）基于BERT的知识库问答实战

基于亚马逊云科技服务，构建大语言模型问答知识库

基于大语言模型LangChain框架：知识库问答系统实践

Android知识问答与分享项目实战

【基础篇001】⼤模型理论基础——初探大模型：起源与发展《AI 大模型应用开发实战指南》

基于大模型构建本地知识库

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

NEFU 117 素数个数的位数

Closest Common Ancestors (Lca,tarjan)

ELK部署

【转载】Hive笔记整理（三）

SQL语句（一）基本表的定义

关于Java web开发中的MySQL的事务语句

MFC创建自定义窗体

如何用一句话激怒程序员？

《逆袭大学》文摘——9.4 基础和应用的平衡中找到大学的节奏

【spring源码分析】@Value注解原理

每日归档

更多

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)