最近国内的大模型可谓是遍地开花,你瞧瞧:
这么火,我也想搞一个试试,于是就有了这篇文章!对,你没看错,就是白嫖。
毕竟人家清华都开源了,哈哈哈hoho~~
先把开源地址贴一下,老铁们可以自行去瞧一瞧:
https://github.com/THUDM/ChatGLM-6B
https://huggingface.co/THUDM/chatglm-6b
ChatGLM-6B 是一个开源的、支持中英双语问答的对话语言模型,基于 General Language Model (GLM) 架构,具有 62 亿参数。
结合模型量化技术,用户可以在消费级的显卡上进行本地部署(INT4 量化级别下最低只需 6GB 显存)。
ChatGLM-6B 使用了和 ChatGLM 相同的技术,针对中文问答和对话进行了优化。
经过约 1T 标识符的中英双语训练,辅以监督微调、反馈自助、人类反馈强化学习等技术的加持,62 亿参数的 ChatGLM-6B 已经能生成相当符合人类偏好的回答。
```在这里插入图片描述
最重要的一点,人家遵循Apache-2.0协议。
下面开干吧!
### [](https://blog.csdn.net/mama19971023/article/details/140522855?spm=1001.2014.3001.5502)准备机器
毕竟是要搭建可以跑起来的环境,机器肯定是必不可少的。好在阿里云有白嫖的使用机器。
1. 进去阿里云免费试用活动页面 [https://free.aliyun.com/](https://free.aliyun.com/)
2. 申请试用PAI-DSW资源,点击页面上的【立即试用】就可以了。(我因为已经试用了,所以显示的是“已试用”)
![](https://i-blog.csdnimg.cn/blog_migrate/e0228105331ec2fbd67eb756aa0b8aba.png)
3. 参考试用教程创建PAI平台示例。或者接着往下看
4. 在阿里云页面搜索PAI,点击立即开通,然后进入到PAI控制台。
开通的时候,有些可选的资源(比如NAS存储等),我因为没有,所以都没选。
![](https://i-blog.csdnimg.cn/blog_migrate/0d90880cd8181fc4e072f4f768f94a7a.png)
5. 进入控制台后,选择创建DSW实例
![](https://i-blog.csdnimg.cn/blog_migrate/c772fc00547e418131b54abd5a4fb66c.png)
创建的时候,资源选择GPU资源,然后选择 支持资源包抵扣的那款 ecs.gn6v-c8g1.2xlarge
> 如果资源组下拉框是空白的,那么你需要在 上图左侧【工作空间详情】菜单,配置一下计算资源。
>
> 配置的按钮在工作空间详情页面右边【资源管理】,选择public-cluster 即可
镜像选择pytorch1.12,点击创建完成,机器就白嫖好了。
### [](https://blog.csdn.net/mama19971023/article/details/140522855?spm=1001.2014.3001.5502)下载大模型
前面实例创建完之后,点击【打开】,会进入到机器的web控制台(Data Science Workshop)。
![](https://i-blog.csdnimg.cn/blog_migrate/7493ad4fa2652c2e73bbe05aa27a0078.png)
在这里,可以在Terminal里面操作了。
1. 先执行安装git相关命令
> sudo apt-get update
>
> sudo apt-get install git-lfs
2. 下载模型仓库(因为模型比较大,所以下载下来再执行方便些)
> git clone [email protected]:THUDM/chatglm-6b
3. 下载模型运行代码
> git clone [https://github.com/THUDM/ChatGLM-6B.git](https://github.com/THUDM/ChatGLM-6B.git)
### [](https://blog.csdn.net/mama19971023/article/details/140522855?spm=1001.2014.3001.5502)部署启动
#### [](https://blog.csdn.net/mama19971023/article/details/140522855?spm=1001.2014.3001.5502)部署前修改源码
因为我们已经把模型下载下来了,部署前,需要把代码中的模型路径改成你自己的。
比如我们的模型下载在/mnt/workspace/chatglm-6b,我们就需要把 ChatGLM-6B 下的两个文件路径都改一下:
* cli\_demo.py:命令行交互界面
* web\_demo.py:Web图形交互界面
![](https://i-blog.csdnimg.cn/blog_migrate/83bef2f60e46d182e30e8b206eee6b81.png)
#### [](https://blog.csdn.net/mama19971023/article/details/140522855?spm=1001.2014.3001.5502)启动
进入到ChatGLM-6B目录,执行启动命令即可
> python web\_demo.py
命令执行成功,会提示。就表示启动成功了。
> Running on local URL: [http://127.0.0.1:7860](http://127.0.0.1:7860/)
>
> To create a public link, set `share=True` in `launch()`.
如果想外网访问,就还需要改一点源码。在web\_demo.py文件最末尾,设置share=True
> 修改前:demo.queue().launch(share=False, inbrowser=True)
>
> 修改后:demo.queue().launch(share=True, inbrowser=True)
改完后,保存,再次启动,会打印出Running on public URL:XXXX,通过这个链接即可打开体验。
启动中如果遇到缺少一些module,可通过【pip install xxx】进行安装,安装完之后再执行启动命令
### [](https://blog.csdn.net/mama19971023/article/details/140522855?spm=1001.2014.3001.5502)使用效果
使用效果的话,只能说还有相当长的路需要走。
![](https://i-blog.csdnimg.cn/blog_migrate/8022db3d741f27ff9db8e99bae5745e9.png)
答的是有板有眼的!但是,实际上…
我把完整的代码贴在下面,大家可自行体验评论:
import java.util.concurrent.Thread;
import java.util.concurrent.Executors;
import java.util.concurrent.ExecutorService;
import java.util.concurrent.Executors.newSingleThreadExecutor();
import java.util.concurrent.Future;
public class TwoThreads交替打印String {
public static void main(String[] args) {
int numThreads = 2;
String str = “Hello, World!”;
int index = 0;
ExecutorService executor = Executors.newSingleThreadExecutor();
List<Future> futures = new ArrayList<>();
for (int i = 0; i < numThreads; i++) {
int size = str.length();
int start = index * size + i;
int end = start + size;
int buffer = start * size + size;
// 打印前一个线程的输出
futures.add(executor.submit(() -> {
Thread thread = new Thread(new MyThread(str, buffer));
thread.start();
}));
// 打印当前线程的输出
futures.add(executor.submit(() -> {
Thread thread = new Thread(new MyThread(str, buffer));
thread.start();
}));
// 等待当前线程完成
thread.join();
// 打印下一个线程的输出
futures.add(executor.submit(() -> {
Thread thread = new Thread(new MyThread(str, buffer));
thread.start();
}));
index += size;
}
// 打印所有线程的输出
for (Future future : futures) {
future.get();
}
executor.shutdown();
}
private static class MyThread implements Runnable {
private final String str;
private final int buffer;
public MyThread(String str, int buffer) {
this.str = str;
this.buffer = buffer;
}
@Override
public void run() {
for (int i = 0; i < buffer; i++) {
System.out.print(str.charAt(i) + " ");
}
}
}
}
为了帮助大家更好地把握AI大模型的学习和发展机遇,下面提供一份AI大模型的学习路线图以及相关的学习资源,旨在帮助您快速掌握AI大模型的核心技术和应用场景。
**这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【`保证100%免费`】**
![在这里插入图片描述](https://i-blog.csdnimg.cn/direct/3f152b1456fa464eb06f555f040b4035.jpeg)
#### [](https://blog.csdn.net/Android23333/article/details/141086736?spm=1001.2014.3001.5502)一、大模型全套的学习路线
学习大型人工智能模型,如GPT-3、BERT或任何其他先进的神经网络模型,需要系统的方法和持续的努力。既然要系统的学习大模型,那么学习路线是必不可少的,下面的这份路线能帮助你快速梳理知识,形成自己的体系。
**L1级别:AI大模型时代的华丽登场**
![](https://i-blog.csdnimg.cn/blog_migrate/5ed4acc5292ad048392366336b8ff1ca.png)
**L2级别:AI大模型API应用开发工程**
![](https://i-blog.csdnimg.cn/blog_migrate/674d769fcd4eaafc57d5efbca3313684.png)
**L3级别:大模型应用架构进阶实践**
![](https://i-blog.csdnimg.cn/blog_migrate/8ddaa365f2b79ea68c0521f48b09ead1.png)
**L4级别:大模型微调与私有化部署**
![](https://i-blog.csdnimg.cn/blog_migrate/2226c8100dbfa162ed89246664014d22.png)
一般掌握到第四个级别,市场上大多数岗位都是可以胜任,但要还不是天花板,天花板级别要求更加严格,对于算法和实战是非常苛刻的。建议普通人掌握到L4级别即可。
#### [](https://blog.csdn.net/Android23333/article/details/141086736?spm=1001.2014.3001.5502)二、640套AI大模型报告合集
这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。
![img](https://i-blog.csdnimg.cn/blog_migrate/65b8d4a2456d7e87091dd30dd77b9506.png)
#### [](https://blog.csdn.net/Android23333/article/details/141086736?spm=1001.2014.3001.5502)三、大模型经典PDF籍
随着人工智能技术的飞速发展,AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型,如GPT-3、BERT、XLNet等,以其强大的语言理解和生成能力,正在改变我们对人工智能的认识。 那以下这些PDF籍就是非常不错的学习资源。
![img](https://i-blog.csdnimg.cn/blog_migrate/f24835641125fd8514ca947213ceb376.png)
#### [](https://blog.csdn.net/Android23333/article/details/141086736?spm=1001.2014.3001.5502)四、AI大模型商业化落地方案
![img](https://i-blog.csdnimg.cn/blog_migrate/f0f3a6d06d3f05c037af554a955041ee.png)
### [](https://blog.csdn.net/Android23333/article/details/141086736?spm=1001.2014.3001.5502)五、面试资料
我们学习AI大模型必然是想找到高薪的工作,下面这些面试题都是总结当前最新、最热、最高频的面试题,并且每道题都有详细的答案,面试前刷完这套面试题资料,小小offer,不在话下。
![在这里插入图片描述](https://i-blog.csdnimg.cn/blog_migrate/d089abc1bbdbcb71b7f277249f458197.png)
**这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【`保证100%免费`】**
![在这里插入图片描述](https://i-blog.csdnimg.cn/direct/0c5680f52bfa402db07d6138fec8cf2b.jpeg)