使用ollama导入模型 - 代码天地

使用ollama导入模型

编程语言 2025-04-11 23:06:25 阅读次数: 0

ollama可以轻松在本地部署大语言模型，简单方便，并且内置了丰富的大语言模型库，涵盖多种类型的模型，可以很方便的拉取模型。但是有时候想要通过ollama部署自己的大语言模型，或者从huggingface、hf-mirror以及modelscope上下载模型，就需要先将模型导入到ollama，然后进行运行。

目前从上面网站上下载的原始模型文件主要为.safetensors格式或者.gguf格式。

1、导入.safetensors 模型或适配器

从safetensors权重导入模型，首先需要创建一个Modelfile文件，其中包含一个指向包含你的 Safetensors 权重的目录的 FROM 命令

模型目录应包含支持架构的 Safetensors 权重。

目前支持的模型架构：

Llama（包括 Llama 2、Llama 3、Llama 3.1 和 Llama 3.2）
Mistral（包括 Mistral 1、Mistral 2 和 Mixtral）
Gemma（包括 Gemma 1 和 Gemma 2）
Phi3

Modelfile内容包括：

FROM <model directory>

如下，指向.safetensors文件所在的文件夹

从 Safetensors 权重导入微调适配器

扫描二维码关注公众号，回复： 17616583 查看本文章

Modelfile内容包括：

FROM <base model name>

ADAPTER <path to safetensor adapter>

目前支持的 Safetensor 适配器：

Llama（包括 Llama 2、Llama 3 和 Llama 3.1）
- Mistral（包括 Mistral 1、Mistral 2 和 Mixtral）
  - Gemma（包括 Gemma 1 和 Gemma 2）

从创建 Modelfile 的目录中运行 ollama create 命令

ollama create my-model-name -f <path of model_file>

另外，可以使用ollama show --modulefile <model name>查看相同架构的模型的modelfile的写法。

2、导入 GGUF 的模型或适配器

可以通过以下方式获取 GGUF 模型或适配器：

使用 Llama.cpp 中的 convert_hf_to_gguf.py 脚本将 Safetensors 模型转换为 GGUF 模型；
使用 Llama.cpp 中的 convert_lora_to_gguf.py 脚本将 Safetensors 适配器转换为 GGUF 适配器；
从 HuggingFace 等地方下载模型或适配器

要导入 GGUF 模型，创建一个 Modelfile，内容包括：

FROM /path/to/file.gguf

与safetensors文件不同，这里直接指向gguf文件。

对于 GGUF 适配器，创建 Modelfile，内容如下：

FROM /path/to/file.gguf

ADAPTER /path/to/file.gguf

在导入 GGUF 适配器时，重要的是使用与创建适配器时所用的相同基础模型。

一旦你创建了 Modelfile，请使用 ollama create 命令来构建模型。

ollama create my-model-name -f <path of model_file>

3、量化模型

量化模型可以让你以更快的速度和更少的内存消耗运行模型，但精度会有所降低。

Ollama 可以使用 -q/--quantize 标志与 ollama create 命令将基于 FP16 和 FP32 的模型量化为不同的量化级别。

首先，创建一个包含你希望量化的 FP16 或 FP32 基础模型的 Modelfile。

FROM /path/to/model

使用 ollama create 来创建量化模型。

ollama create --quantize q4_K_M mymodel

支持的量化方式

q4_0
q4_1
q5_0
q5_1
q8_0
q3_K_S
q3_K_M
q3_K_L
q4_K_S
q4_K_M
q5_K_S
q5_K_M
q6_K

4、llama.cpp的下载和安装

llama.cpp 是一个开源项目，它提供了一种简单而高效的方法来进行模型的量化，同时还能进行模型格式的转换。对于safetensors格式的模型，有些模型ollama无法导入（如 deepseek的模型），因此需要使用llama.cpp来进行格式的转换。使用方式如下：

（1）llama.cpp下载

git clone https://github.com/ggerganov/llama.cpp

cd llama.cpp

（2）安装python库

pip install -r requirements.txt

（3）将 safetensors 转换为 gguf 格式

python convert_hf_to_gguf.py <model path> --outtype f16

--outtype后面跟量化类型，使用f16或者f32表示不进行量化。

以上便是使用ollama导入模型的方法。

猜你喜欢

转载自blog.csdn.net/wjj_fire/article/details/145559832

使用ollama导入模型

【大模型实战】使用Ollama环境搭建以及GGUF模型导入

Ollama 自定义导入模型

通过Ollama 使用Gemma 模型

ollama 使用自己的微调模型

ollama 使用自定义大模型

Ollama：本地大语言模型（LLM）部署 && 使用 Ollama 构建一个智能问答系统

Ollama：一站式 AI 模型管理与交互平台，Ollama 简介，Ollama 的核心功能，Ollama 的使用场景

掌握 llama.cpp 量化部署与 ollama 导入模型，轻松搞定模型部署难题！

使用Ollama+Python本地环境搭建AI大模型

使用 Ollama 本地部署 DeepSeek 模型及 Chatbox 配置

Ai学习之Ollama使用GPU运行模型的环境部署

本地ollama+deepseek模型搭建及使用（内外网环境）

在WSL中高效使用Windows目录下的Ollama模型

【大模型实战】使用Ollama+OpenWebUI实现本地Deepseek R1模型搭建

玩转大语言模型——使用langchain和Ollama本地部署大语言模型

大模型学习-使用ollama将大模型部署在java项目中

【大模型实战】使用Ollama+Chatbox实现本地Deepseek R1模型搭建

Ollama初步使用

Ollama 在 LangChain 中的使用

Ollama 使用指南

qt 调用本地Ollama 的模型

SpringBoot集成Ollama本地模型

使用Ollama本地部署 Llama3大模型！最简单的方法，无需GPU也能使用

使用 Docker 安装 Ollama 部署本地大模型并接入 One-API

使用MaxKB添加本地部署的Ollama大语言模型搭建智能聊天系统

docker desktop使用ollama在GPU上运行deepseek r1大模型

本地搭建AI开发平台Dify并使用Ollama添加大语言模型保姆级教程

一文教你在windows上实现ollama+open webui、外网访问本地模型、ollama使用GPU加速

开源模型应用落地-qwen模型小试-Qwen2.5-7B-Instruct-玩转ollama-Modelfile使用技巧（四）

今日推荐

Electron中的关于静态资源加载问题解决方案

《Cursor-AI编程》基础篇-界面指南

《Cursor-AI编程》基础篇-Tab代码智能补充

《Cursor-AI编程》基础篇-Composer功能详解

《Cursor-AI编程》基础篇-Chat功能详解

《Cursor-AI编程》进阶篇-自定义模型

《Cursor-AI编程》进阶篇-上下文详解

【大模型系列篇】最强检索增强技术GraphRAG基本原理详解

【大模型系列篇】基于Ollama和GraphRAG v2.0.0快速构建知识图谱

解释什么是迁移学习？在 CNN 中如何应用？（面试题200合集，高频、关键）

解释数据增强（Data Augmentation）的概念和方法（（面试题200合集，高频、关键））

揭秘大模型“魔法”：Function Calling 让 AI 不止会说，更能“做”！

周排行

ConfigurationClassParser类的parse方法源码解析

基础大讲堂-java 位运算符

ConsecutiveInteger判断给定的整数n能否表示成连续的m(m>1)个正整数之和

多项式问题之六——多项式快速幂

Spring Security技术栈开发企业级认证与授权（四）RESTful API服务异常处理

Linux基础命令---apachectl

MATLAB中的线性插值

Unity编辑器拓展之十七：NGUI ComponentSelector增加搜索框

SqlServer 备份还原教程

[Unity动画]01.

每日归档

更多

2025-04-12(10529)

2025-04-11(9561)

2025-04-10(1213)

2025-04-09(10354)

2025-04-08(12998)

2025-04-07(0)

2025-04-06(0)

2025-04-05(0)

2025-04-04(0)

2025-04-03(0)