大模型框架xinference的本地安装注意事项 - 代码天地

大模型框架xinference的本地安装注意事项

企业开发 2024-11-03 00:25:36 阅读次数: 0

pip install “xinference[all]”

问题

ERROR: Could not build wheels for llama-cpp-python, which is required to install pyproject.toml-based projects

根据系统选择官方编译后的whl下载进行离线安装。

官方网址
https://github.com/abetlen/llama-cpp-python/releases

问题，cuda

sudo apt install nvidia-cuda-toolkit

启动

xinference-local --host 0.0.0.0 --port 9997

因为xinference默认的是从huggingface下载大模型，网络原因根本下载不下来，需要更换为国内的源，这样，上面那句命令就要变为：
XINFERENCE_MODEL_SRC=modelscope xinference-local --host 0.0.0.0 --port 9997
这样，下载源就换为阿里的源了，同时服务也开启了。
这时候你在浏览器打开http://host-ip:9997/应该可以看到xinference的界面了。
注意：windows中使用127.0.0.1

猜你喜欢

转载自blog.csdn.net/philosophyatmath/article/details/140956156

大模型框架xinference的本地安装注意事项

oracle本地安装注意事项

【大模型】Xinference的安装和部署

【大模型推理】vLLM推理框架基本使用及注意事项

在本地安装和部署 Xinference，并下载对应的模型

监控设备安装的九大注意事项

FastAdmin框架学习-安装后的注意事项

yii2框架安装（Advanced）及注意事项

OSSIM安装注意事项

RMS安装注意事项

PL/安装注意事项

hadoop安装注意事项

SeedDms安装与注意事项

nexus安装注意事项

安装SSH注意事项

apache安装注意事项

webstorm安装注意事项

Oracle安装注意事项

openMVG 安装注意事项

CentOS安装及注意事项

安装Ubuntu的注意事项

Python安装注意事项

FastDFS安装注意事项

ssdb安装注意事项

mongodb的安装及注意事项

docker安装注意事项

wampsever 安装注意事项

安装Mysql的注意事项

MongoDB安装注意事项

Ubuntu安装注意事项

今日推荐

Electron中的关于静态资源加载问题解决方案

《Cursor-AI编程》基础篇-界面指南

《Cursor-AI编程》基础篇-Tab代码智能补充

《Cursor-AI编程》基础篇-Composer功能详解

《Cursor-AI编程》基础篇-Chat功能详解

《Cursor-AI编程》进阶篇-自定义模型

《Cursor-AI编程》进阶篇-上下文详解

【大模型系列篇】最强检索增强技术GraphRAG基本原理详解

【大模型系列篇】基于Ollama和GraphRAG v2.0.0快速构建知识图谱

解释什么是迁移学习？在 CNN 中如何应用？（面试题200合集，高频、关键）

解释数据增强（Data Augmentation）的概念和方法（（面试题200合集，高频、关键））

揭秘大模型“魔法”：Function Calling 让 AI 不止会说，更能“做”！

周排行

ConfigurationClassParser类的parse方法源码解析

基础大讲堂-java 位运算符

ConsecutiveInteger判断给定的整数n能否表示成连续的m(m>1)个正整数之和

多项式问题之六——多项式快速幂

Spring Security技术栈开发企业级认证与授权（四）RESTful API服务异常处理

Linux基础命令---apachectl

MATLAB中的线性插值

Unity编辑器拓展之十七：NGUI ComponentSelector增加搜索框

SqlServer 备份还原教程

[Unity动画]01.

每日归档

更多

2025-04-12(10529)

2025-04-11(9561)

2025-04-10(1213)

2025-04-09(10354)

2025-04-08(12998)

2025-04-07(0)

2025-04-06(0)

2025-04-05(0)

2025-04-04(0)

2025-04-03(0)