Windows10上部署DeepSeek R1保姆式操作详解（Xinference方式）

企业开发 2025-04-08 10:58:24 阅读次数: 0

目标：公司内部通过DeepSeek+RAG本地化部署搭建知识库。

一、硬件配置

CPU：Intel(R) Xeon(R) Gold 6138 CPU @ 2.00GHz 2.00 GHz (2 个处理器)48核

GPU：英伟达4070Ti Super 16GB，两块，共32GB显存

RAM：128GB

硬盘：4TB M2；RAID5磁盘阵列，30TB；

二、安装步骤

1.基础环境安装

因服务器上有其它使用python环境的应用，故使用conda来管理python环境。

（1）安装conda管理器

下载地址：https://docs.conda.io/en/latest/miniconda.html

安装好后打开它，最好使用管理员模式打开。

（2）创建虚拟环境Xinference并激活它

依次敲入指令，创建并激活项目所需的虚拟环境。
conda create -n Xinference python=3.10.15

conda activate Xinference

（3）安装chatglm-cpp
https://github.com/li-plus/chatglm.cpp/releases

切换到刚下载的文件所在目录，运行指令：

pip install chatglm_cpp-0.4.2-cp310-cp310-win_amd64.whl

（4）安装c、c++编译工具（为安装llama-cpp-python做准备，防止编译出错）
https://visualstudio.microsoft.com/zh-hans/visual-cpp-build-tools/

选择“使用C++的桌面开发”安装，如下图：

安装后，从Visual Studio 2022安装的入口打开命令行，再进入conda虚拟环境。（这个地方折腾了好一两个小时，一直出现llama-cpp-python编译错误，最终用此方法解决）还有要注意登录用户需有administrator权限，最好直接使用administrator用户。

在打开的窗口中敲入指令：（具体根据自己conda的安装路径来改）

%WINDIR%\System32\cmd.exe "/K" D:\ProgramFiles\miniconda3\Scripts\activate.bat D:\ProgramFiles\miniconda3

可以单独先安装pip install llama-cpp-python看看能不能成功，再进行下一步。

2.安装Xinfernece

pip install xinference[all]

xinference有好几种支持的模型种类，用all参数代表全部安装，这样以后不管接入哪种大模型都不需要再次安装了。

3.检验环境是否安装成功

检验pytorch是否支持gpu，运行python指令

import torch
print(torch.__version__)
print(torch.cuda.is_available())

如果报错，运行下面指令安装支持gpu的依赖包。（根据自己显卡配置确定cuda版本号）

pip install torch==2.6.0+cu124 torchvision==0.21.0+cu124 torchaudio==2.6.0+cu124 --index-url https://download.pytorch.org/whl/cu124

上面安装时报xformer不兼容，可以到面查找对应的版本进行安装https://github.com/facebookresearch/xformers#installing-xformers

命令：

pip3 install -U xformers --index-url https://download.pytorch.org/whl/cu124

安装后验证是否成功：

三、启动Xinference

xinference-local --host 127.0.0.1 --port 9999

ip地址可以改成局域网的地址，这样就可以在企业内共享了。

运行成功后界面如下

四、配置注册模型文件

1.下载模型文件

到https://huggingface.co/deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B

上下载deepseek模型，除了模型文件，标红框的配置文件也要下载，存放在模型的同一目录中。

2.注册模型文件

3.启动模型文件

五、体验与模型对话

点击下图箭头处，可以启动与大模型的聊天

聊天展示如下

使用conda创建的虚拟环境和安装的依赖包，往同类操作系统复制时，只要直接拷贝过去即可，基本可以与docker的跨系统部署相媲美了。我就是在自己机器上安装好了直接拷贝到服务器上的，正常运行。

猜你喜欢

转载自blog.csdn.net/daobaqin/article/details/146540218

Windows10上部署DeepSeek R1保姆式操作详解（Xinference方式）

Windows10上部署DeepSeek R1保姆式操作详解（ollama方式+ChatBox）

Ubuntu 22 Linux上部署DeepSeek R1保姆式操作详解（Xinference方式）

Ubuntu 22 Linux上部署DeepSeek R1保姆式操作详解（ollama方式）

Windows10上部署DeepSeek+RAG知识库操作详解（Dify方式）之1

Windows10上部署DeepSeek+RAG知识库操作详解（Dify方式）之2

Windows10上部署DeepSeek+RAG知识库操作详解（Dify方式）之3

(2025)通过Ollama光速部署本地DeepSeek-R1模型(支持Windows10/11)

[AI]Mac本地部署Deepseek R1模型 — — 保姆级教程

快速部署 DeepSeek R1 模型

windows部署具备深度思考的大模型DeepSeek - R1 并接入Page Assist。

Ubuntu 22 Linux上部署DeepSeek+RAG知识库操作详解（Dify方式）之1

DeepSeek R1蒸馏小模型本地部署测试

【大模型】蓝耘智算云平台快速部署DeepSeek R1/R3大模型详解

【干货教程】Windows电脑本地部署运行DeepSeek R1大模型（基于Ollama和Chatbox）

windows10激活方式

Deepseek官网太卡，教你5分钟在云服务器上部署Deepseek-R1

在Kubernetes上部署DeepSeek-R1进行高效AI推理

Ubuntu 22 Linux上部署DeepSeek+RAG知识库操作详解（Dify方式）之3

Ubuntu 22 Linux上部署DeepSeek+RAG知识库操作详解（Dify方式）之2

Win10+Ollama本地部署DeepSeek-R1

《从零开始DeepSeek R1搭建本地知识库问答系统》二：Ollama 部署 DeepSeek R1 蒸馏模型及Api测试

【大模型】蓝耘智算云平台对接满血DeepSeek R1/R3 实战详解

vue 环境搭建踩坑（renren-fast 前端在windows10上部署）

【TcaplusDB知识库】如何在windows10上部署 TcaplusDB Local版?

Windows下从零开始基于Ollama与Open-WebUI本地部署deepseek R1详细指南（包含软件包和模型网盘下载）

DeepSpeed 在三台T4卡上部署deepseek-r1:32b

在m4芯片的macbook pro上部署并推理deepseek-r1到底能有多快呢

本地部署Deepseek R1模型，搭建个人知识库

(含离线包) 基于Ubuntu22.04 LTS 部署Ollama + DeepSeek R1 + Open WebUI

今日推荐

Electron中的关于静态资源加载问题解决方案

《Cursor-AI编程》基础篇-界面指南

《Cursor-AI编程》基础篇-Tab代码智能补充

《Cursor-AI编程》基础篇-Composer功能详解

《Cursor-AI编程》基础篇-Chat功能详解

《Cursor-AI编程》进阶篇-自定义模型

《Cursor-AI编程》进阶篇-上下文详解

【大模型系列篇】最强检索增强技术GraphRAG基本原理详解

【大模型系列篇】基于Ollama和GraphRAG v2.0.0快速构建知识图谱

解释什么是迁移学习？在 CNN 中如何应用？（面试题200合集，高频、关键）

解释数据增强（Data Augmentation）的概念和方法（（面试题200合集，高频、关键））

揭秘大模型“魔法”：Function Calling 让 AI 不止会说，更能“做”！

周排行

ConfigurationClassParser类的parse方法源码解析

基础大讲堂-java 位运算符

ConsecutiveInteger判断给定的整数n能否表示成连续的m(m>1)个正整数之和

多项式问题之六——多项式快速幂

Spring Security技术栈开发企业级认证与授权（四）RESTful API服务异常处理

Linux基础命令---apachectl

MATLAB中的线性插值

Unity编辑器拓展之十七：NGUI ComponentSelector增加搜索框

SqlServer 备份还原教程

[Unity动画]01.

每日归档

2025-04-12(10529)

2025-04-11(9561)

2025-04-10(1213)

2025-04-09(10354)

2025-04-08(12998)

2025-04-07(0)

2025-04-06(0)

2025-04-05(0)

2025-04-04(0)

2025-04-03(0)