ChatGPT实战与私有化大模型落地

其他 2023-09-18 18:11:41 阅读次数: 0

文章目录

大模型现状
领域大模型训练技巧
领域大模型产品形态及落地场景

大模型现状

baseline底座选择

在这里插入图片描述

数据构造

在这里插入图片描述

领域数据
书籍数据
网站数据
新闻内容
指令微调数据

混合数据（公用数据+领域数据，比例1：5 ）避免知识遗忘，导致通用能力下降。

迁移方法

在这里插入图片描述

资源不充足的时候，在chat模型基础上训练
资源充足的时候，在Base模型上训练
千万级别的数据，在chat模型上不要用全量数据进行训练。

评价

在这里插入图片描述

思考

在这里插入图片描述

领域大模型训练技巧

在这里插入图片描述

ChatGPTBook：github.com/liucongg/ChatGPTBook

Tokenizer

在这里插入图片描述

分布式深度学习

在这里插入图片描述

扫描二维码关注公众号，回复： 16754097 查看本文章

数据并行

在这里插入图片描述

管道并行

在这里插入图片描述

向量并行

在这里插入图片描述

分布式框架——Megatron-LM

在这里插入图片描述

分布式深度学习框架——Colossal-AI

在这里插入图片描述

分布式深度学习框架——DeepSpeed

在这里插入图片描述

P-tuning 微调

在这里插入图片描述

资源消耗

在这里插入图片描述

模型推理加速

模型推理加速方法——FastLLM

在这里插入图片描述

模型推理加速方法——VLLm

在这里插入图片描述

领域大模型产品形态及落地场景

在这里插入图片描述

ChatGPT用户视角思考

在这里插入图片描述

ChatGPT企业视角思考

在这里插入图片描述

企业级ChatGPT的建设要素

在这里插入图片描述

选择优质的应用场景

在这里插入图片描述

ChatGPT场景设计-工业制造

在这里插入图片描述

ChatGPT场景设计-文案编写

在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/uncle_ll/article/details/132781105

ChatGPT实战与私有化大模型落地

ChatGPT原理与实战：大型语言模型的算法、技术和私有化》揭开ChatGPT神秘技术黑盒！

【码银送书第六期】《ChatGPT原理与实战：大型语言模型的算法、技术和私有化》

私有化

私有化部署chatGPT，告别网络困扰

Chatgpt私有化部署(全流程)

大语言模型之六- LLM之企业私有化部署架构

C#开源项目：私有化部署LLama推理大模型

AutoDev 1.1.3 登场，个性化 AI 辅助：私有化大模型、自主设计 prompt、定义独特规则...

股票私有化

Python 私有化

python~私有化

私有化，拷贝

私有化预期终于落地，海尔智家将迎来更多可能！

【AI实战】给类ChatGPT的大语言模型外挂私有知识库

本地私有化部署大模型RWKV-懒人包一键安装享受专属免费大模型-RWKV Runner

私有化部署ChatGPT道路上的各种坑

GPT4All：ChatGPT本地私有化部署,终生免费

如何让ChatGPT学习私有化知识，并且保留部分对话功能

变量私有化和函数私有化，以及私有化的好处

java构造方法私有化

私有化的标记方法

GIL，深浅拷贝，私有化

python--私有化

私有化与property属性

python之类的私有化属性

python中的私有化

JavaScript 属性私有化

【javascript】私有化变量

python-12私有化

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

static方法和非static方法的区别（java）

如何查找计算机专业paper

java.lang.ClassFormatError: Incompatible magic value 0 in class file com/sitecha

跳跃游戏II

stm32_之【建立工程】

TeaWeb v0.0.9 发布，统计底层优化、主机监控功能改进

事件分发 -----控制字体大小

JavaScript DOM练习（动态表格添加） December 25，2019

JSF Scope & CDI

实现从零搭建一个登录注册页面（附源代码）

每日归档

更多

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)