Ubuntu 22 Linux上部署DeepSeek R1保姆式操作详解（Xinference方式）

企业开发 2025-04-08 10:56:54 阅读次数: 0

一、安装步骤

1.基础环境安装

安装显卡驱动、cuda，根据自己硬件情况查找相应编号，本篇不介绍这部分内容，只给出参考指令，详情请读者自行查阅互联网其它参考资料。

sudo apt install nvidia-utils-565-server

sudo apt install nvidia-cuda-toolkit

确认安装结果的指令和输出如下：

因机器上有其它使用python环境的应用，故使用conda来管理python环境。

（1）安装conda管理器

更新软件包

sudo apt update

sudo apt upgrade

安装基本依赖

sudo apt install wget curl bzip2 ca-certificates

下载Anaconda安装脚本

wget https://repo.anaconda.com/archive/Anaconda3-2023.03-1-Linux-x86_64.sh

运行安装脚本，按提示一路执行下去，中间需要输入yes并确认

bash Anaconda3-2023.03-1-Linux-x86_64.sh

初始化Anaconda，执行下面指令，或者关闭命令窗口后重新开启一个窗口。

source ~/.bashrc

验证安装结果

conda env list

（2）创建xinference所需的虚拟环境并激活它

conda create -n Xinference python=3.10.15

conda activate Xinference

（3）安装chatglm-cpp

https://github.com/li-plus/chatglm.cpp/releases

切换到刚下载的文件所在目录，运行指令：

pip install chatglm_cpp-0.4.2-cp310-cp310-manylinux_2_17_x86_64.manylinux2014_x86_64.whl

2.安装Xinfernece

pip install xinference[all]

安装过程不报错就ok了，过程需要很久，试了几次，过程中出问题最多的依然是llama_cpp_python，检查gcc编译器等因素，最终如下。

xinference有好几种支持的种类，如gpu/cpu/transformers/vllm/metal，用all参数代表全部安装，这样以后不管接入哪种类型的大模型都不需要再次安装了。

3.检验环境是否安装成功

检验pytorch是否支持gpu，运行python指令

    import torch
    print(torch.__version__)
    print(torch.cuda.is_available())

如果报错，运行下面指令安装支持gpu的依赖包。（根据自己显卡配置确定cuda版本号，ubuntu系统正常在安装xinference过程中已经安装了以下依赖包）

pip install torch==2.6.0+cu128 torchvision==0.21.0+cu128 torchaudio==2.6.0+cu128 --index-url https://download.pytorch.org/whl/cu128

pip3 install -U xformers --index-url https://download.pytorch.org/whl/cu128

二、启动Xinference

xinference-local --host 0.0.0.0 --port 9999

windows下只能使用127.0.0.1或者局域网中的本机ip地址，linux可以使用0.0.0.0包含127.0.0.1和局域网中的本机ip地址，这样就可以在企业内共享了，同时也能使用127.0.0.1访问。

运行成功后界面如下

三、配置注册模型文件

1.下载模型文件

到https://huggingface.co/deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B

如果不能科学上网，打不开上面网址，也可以到国内阿里的开源网站下载：

https://www.modelscope.cn/models/deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B/files

红色框内的文件全部下载，保存到同一个目录中，根据硬件配置选择不同的模型文件，这里我是演示，所以选择1.5B，一般企业内做知识库，建议至少选择32B，显存32GB以上，我试过32GB跑32B的模型很吃力，响应很慢。

2.注册模型文件

上图中的路径要换成linux的目录格式，如/home/qkm/deepseekR1/1-5B，因为截图忘保存了，用windows模式下的截图替换了一下。

3.启动模型文件

四、体验与模型对话

点击下图箭头处，可以启动与大模型的聊天

使用conda创建的虚拟环境和安装的依赖包，往同类操作系统复制时，只要直接拷贝过去即可，基本可以与docker的跨系统部署相媲美了。

猜你喜欢

转载自blog.csdn.net/daobaqin/article/details/146768740

Ubuntu 22 Linux上部署DeepSeek R1保姆式操作详解（Xinference方式）

Ubuntu 22 Linux上部署DeepSeek R1保姆式操作详解（ollama方式）

Windows10上部署DeepSeek R1保姆式操作详解（Xinference方式）

Ubuntu 22 Linux上部署DeepSeek+RAG知识库操作详解（Dify方式）之1

Ubuntu 22 Linux上部署DeepSeek+RAG知识库操作详解（Dify方式）之3

Ubuntu 22 Linux上部署DeepSeek+RAG知识库操作详解（Dify方式）之2

Windows10上部署DeepSeek R1保姆式操作详解（ollama方式+ChatBox）

(含离线包) 基于Ubuntu22.04 LTS 部署Ollama + DeepSeek R1 + Open WebUI

Linux(ubuntu) 部署xinference

linux ubuntu ssh 22 端口更改

【linux】在linux（ubuntu）上部署web应用

快速部署 DeepSeek R1 模型

保姆级Ubuntu20/22安装Kubernetes与踩坑

Ubuntu server18、20、22安装、部署Docker

Ubuntu22 使用devstack一键部署OpenStack

Ubuntu上部署tomcat

Ubuntu上部署Jenkins

Ubuntu18、Ubuntu20、Ubuntu22部署zabbix6.0

[AI]Mac本地部署Deepseek R1模型 — — 保姆级教程

ubuntu 22 端口

ubuntu 打开 22端口

ubuntu 22端口不通

【R语言】Linux-Ubuntu22系统下R语言的安装与卸载（可安装最新版本）

Linux ubuntu服务器开启22端口，connect:fail, reason: connect server 22 port fail

Ubuntu(Linux) mount error(22):解决办法

【Linux环境搭建】Ubuntu 22 安装 InfluxDB 1.8

[分布式trace]在Ubuntu17.10上部署jaeger

Windows10上部署DeepSeek+RAG知识库操作详解（Dify方式）之1

Deepseek官网太卡，教你5分钟在云服务器上部署Deepseek-R1

在Kubernetes上部署DeepSeek-R1进行高效AI推理

今日推荐

Electron中的关于静态资源加载问题解决方案

《Cursor-AI编程》基础篇-界面指南

《Cursor-AI编程》基础篇-Tab代码智能补充

《Cursor-AI编程》基础篇-Composer功能详解

《Cursor-AI编程》基础篇-Chat功能详解

《Cursor-AI编程》进阶篇-自定义模型

《Cursor-AI编程》进阶篇-上下文详解

【大模型系列篇】最强检索增强技术GraphRAG基本原理详解

【大模型系列篇】基于Ollama和GraphRAG v2.0.0快速构建知识图谱

解释什么是迁移学习？在 CNN 中如何应用？（面试题200合集，高频、关键）

解释数据增强（Data Augmentation）的概念和方法（（面试题200合集，高频、关键））

揭秘大模型“魔法”：Function Calling 让 AI 不止会说，更能“做”！

周排行

ConfigurationClassParser类的parse方法源码解析

基础大讲堂-java 位运算符

ConsecutiveInteger判断给定的整数n能否表示成连续的m(m>1)个正整数之和

多项式问题之六——多项式快速幂

Spring Security技术栈开发企业级认证与授权（四）RESTful API服务异常处理

Linux基础命令---apachectl

MATLAB中的线性插值

Unity编辑器拓展之十七：NGUI ComponentSelector增加搜索框

SqlServer 备份还原教程

[Unity动画]01.

每日归档

2025-04-12(10529)

2025-04-11(9561)

2025-04-10(1213)

2025-04-09(10354)

2025-04-08(12998)

2025-04-07(0)

2025-04-06(0)

2025-04-05(0)

2025-04-04(0)

2025-04-03(0)