本地低成本部署deepseek-r1 - 代码天地

本地低成本部署deepseek-r1

企业开发 2025-04-08 12:35:08 阅读次数: 0

本地低成本部署deepseek-r1
一丶首先还是以前文章使用的Xinference.具体看以前文章
二丶首先部署不量化的7b模型
在这里插入图片描述
如果你多张卡可以调整gpu
然后这里咱们部署的是不量化的所以要改一下

在这里插入图片描述
这个是token长度
然后我们在国内下载的就选择

三丶部署部署量化的32b模型

这里如果量化有这个就选这个
token这个你可以从6000慢慢往上加，具体看你显存了

然后你用14B的可以init8,token设置个11000,具体根据自己显卡设置

目前试过的3090也能跑起来,目前我用的是4090d.然后r1是推理模型
在这里插入图片描述
可以看下区别.
最后如果没有搞搞清楚v3，r1状况的，先看一下论文文档，扔碎片一个AI里让它们翻译，不要跟着短视频跑
https://arxiv.org/html/2412.19437v1
https://arxiv.org/abs/2501.12948
然后最后我们xfc需要这个版本才有r1,需要大家下载一下* Pip：pip install ‘xinference==1.2.1’
具体使用哪个模型看你显卡,显存了

猜你喜欢

转载自blog.csdn.net/weixin_45515807/article/details/145515171

本地低成本部署deepseek-r1

deepseek-r1 本地部署

免费教你部署本地部署DeepSeek-R1!

在本地免费部署DeepSeek-R1 详细教学

Win10+Ollama本地部署DeepSeek-R1

基于飞桨框架3.0本地DeepSeek-R1蒸馏版部署实战

本地部署DeepSeek-R1模型（新手保姆教程）

(2025)通过Ollama光速部署本地DeepSeek-R1模型(支持Windows10/11)

三步教你在linux上本地部署DeepSeek-R1

使用ollama一键本地部署DeepSeek-R1

DeepSeek-R1本地化部署全流程

低成本抗衡DeepSeek-R1！阿里重磅开源QwQ-32B，推理模型的“降维打击”来了！

图解DeepSeek-R1

DeepSeek-R1私有化部署——DeepSeek-R1模型微调原理与代码实现

DeepSeek-R1私有化部署——基于 DeepSeek R1 和 Ollama 构建本地知识库(RAG)系统

服务器总是繁忙？DeepSeek-R1本地部署图文版教程来啦

Deepseek-R1本地部署，避免官网服务器繁忙问题

本地化部署DeepSeek-R1蒸馏大模型：基于飞桨PaddleNLP 3.0的实战指南

DeepSeek-R1本地化部署 java调用图文教程（Ollama+Docker+OpenWebUI）

QWQ-32B 本地私有化部署，性能媲美DeepSeek-R1满血版

DeepSeek服务器总是繁忙，试试花三分钟本地部署DeepSeek-R1蒸馏模型解决服务繁忙

【DeepSeek】通过gpt4all进行Deepseek-R1的本地部署（附4种在线打开方式）

PyCharm结合DeepSeek-R1

【AI大模型】Ollama部署本地大模型DeepSeek-R1，交互界面Open-WebUI，RagFlow构建私有知识库

零刻SER9 Pro系列（HX370与AI 365）本地部署DeepSeek-R1详细性能数据对比

DeepSeek-V3到DeepSeek-R1的演进

DeepSeek-R1和DeepSeek-V3的区别

开挂了！只需3分钟搞定DeepSeek-R1部署！

使用服务器部署DeepSeek-R1模型【详细版】

瑞芯微RK3588板子上实地部署Deepseek-R1模型

今日推荐

Electron中的关于静态资源加载问题解决方案

《Cursor-AI编程》基础篇-界面指南

《Cursor-AI编程》基础篇-Tab代码智能补充

《Cursor-AI编程》基础篇-Composer功能详解

《Cursor-AI编程》基础篇-Chat功能详解

《Cursor-AI编程》进阶篇-自定义模型

《Cursor-AI编程》进阶篇-上下文详解

【大模型系列篇】最强检索增强技术GraphRAG基本原理详解

【大模型系列篇】基于Ollama和GraphRAG v2.0.0快速构建知识图谱

解释什么是迁移学习？在 CNN 中如何应用？（面试题200合集，高频、关键）

解释数据增强（Data Augmentation）的概念和方法（（面试题200合集，高频、关键））

揭秘大模型“魔法”：Function Calling 让 AI 不止会说，更能“做”！

周排行

ConfigurationClassParser类的parse方法源码解析

基础大讲堂-java 位运算符

ConsecutiveInteger判断给定的整数n能否表示成连续的m(m>1)个正整数之和

多项式问题之六——多项式快速幂

Spring Security技术栈开发企业级认证与授权（四）RESTful API服务异常处理

Linux基础命令---apachectl

MATLAB中的线性插值

Unity编辑器拓展之十七：NGUI ComponentSelector增加搜索框

SqlServer 备份还原教程

[Unity动画]01.

每日归档

更多

2025-04-12(10529)

2025-04-11(9561)

2025-04-10(1213)

2025-04-09(10354)

2025-04-08(12998)

2025-04-07(0)

2025-04-06(0)

2025-04-05(0)

2025-04-04(0)

2025-04-03(0)