ollama部署deepseek之后，保持模型永远被加载在GPU之中！ - 代码天地

ollama部署deepseek之后，保持模型永远被加载在GPU之中！

企业开发 2025-04-09 21:01:24 阅读次数: 0

常见问题：

我们在使用ollma部署大语言模型的时候,如果部署的模型尺寸较大,往往在第一次加载的时候需要花费大量的时间加载模型;等加载完成后,如果长时间不调用模型,我们会发现模型已经被释放掉了,又要重新加载,导致体验感极差。
这是因为在没被调用时，ollama默认在显存中驻留5min，然后就会自动释放,如果我们两次调用的间隔大于5min的话,那模型已经被释放了，又要重新加载;

解决办法：
如预加载模型,并永远驻留在显存！

  curl http://localhost:11434/api/generate -d '{
    
    "model":"llama2","keep_alive”: -1}

参数：
model：模型名称
keep_alive：保持时间。解释如下“”
持续时间字符串(如‘10M’, ‘24H’);
以秒为单位的数字(如 3600);
-1表示永远驻留在显存中;
0表示接受一次响应后立即清除模型;
使用方法
方法如下:
如预加载模型,并永远驻留在显存

猜你喜欢

转载自blog.csdn.net/ssp584731180/article/details/145606515

ollama部署deepseek之后，保持模型永远被加载在GPU之中！

本地用ollama部署DeepSeek大模型

使用 Ollama 本地部署 DeepSeek 模型及 Chatbox 配置

利用Ollama部署DeepSeek本地模型：从入门到实践

Ai学习之Ollama使用GPU运行模型的环境部署

docker desktop使用ollama在GPU上运行deepseek r1大模型

《大模型部署》——ollama下载及deepseek本地部署（详细快速部署）

【大模型实战篇】--ollama部署本地大模型（deepseek）

【大模型部署实战】Ollama如何保持模型常驻内存，或者显存，如何立刻释放

(2025)通过Ollama光速部署本地DeepSeek-R1模型(支持Windows10/11)

windows+ollama+deepseek+openwebui快速实现本地部署Deepseek

【大模型实战】 Ollama部署满血量化版的DeepSeek R1模型（671B）

使用Ollama本地部署 Llama3大模型！最简单的方法，无需GPU也能使用

本地部署LLM踩坑日记（二）——Ollama更新之后挂载gguf模型的坑

玩转大语言模型——本地部署deepseek R1和本地数据库的小白教程(Ollama+AnythingLLM)

玩转大语言模型——本地部署带聊天界面deepseek R1的小白教程(ollama+chatbox)

【干货教程】Windows电脑本地部署运行DeepSeek R1大模型（基于Ollama和Chatbox）

《从零开始DeepSeek R1搭建本地知识库问答系统》二：Ollama 部署 DeepSeek R1 蒸馏模型及Api测试

Win10+Ollama本地部署DeepSeek-R1

ollama + DeepSeek Windows本地部署在非C盘

Spring AI集成Ollama调用本地大模型DeepSeek

本地ollama+deepseek模型搭建及使用（内外网环境）

【大模型】 DeepSeek不同版本部署的GPU资源需求与性能计算指南

在昇腾GPU上部署DeepSeek大模型与OpenWebUI：从零到生产的完整指南

Ollama 如何让模型保持在内存或卸载

【AI大模型】Ollama部署本地大模型DeepSeek-R1，交互界面Open-WebUI，RagFlow构建私有知识库

Ollama教程与大模型本地部署指南

Ollama+Docker部署本地的大模型

Ollama本地部署大模型及应用

Windows下从零开始基于Ollama与Open-WebUI本地部署deepseek R1详细指南（包含软件包和模型网盘下载）

今日推荐

Electron中的关于静态资源加载问题解决方案

《Cursor-AI编程》基础篇-界面指南

《Cursor-AI编程》基础篇-Tab代码智能补充

《Cursor-AI编程》基础篇-Composer功能详解

《Cursor-AI编程》基础篇-Chat功能详解

《Cursor-AI编程》进阶篇-自定义模型

《Cursor-AI编程》进阶篇-上下文详解

【大模型系列篇】最强检索增强技术GraphRAG基本原理详解

【大模型系列篇】基于Ollama和GraphRAG v2.0.0快速构建知识图谱

解释什么是迁移学习？在 CNN 中如何应用？（面试题200合集，高频、关键）

解释数据增强（Data Augmentation）的概念和方法（（面试题200合集，高频、关键））

揭秘大模型“魔法”：Function Calling 让 AI 不止会说，更能“做”！

周排行

ConfigurationClassParser类的parse方法源码解析

基础大讲堂-java 位运算符

ConsecutiveInteger判断给定的整数n能否表示成连续的m(m>1)个正整数之和

多项式问题之六——多项式快速幂

Spring Security技术栈开发企业级认证与授权（四）RESTful API服务异常处理

Linux基础命令---apachectl

MATLAB中的线性插值

Unity编辑器拓展之十七：NGUI ComponentSelector增加搜索框

SqlServer 备份还原教程

[Unity动画]01.

每日归档

更多

2025-04-12(10529)

2025-04-11(9561)

2025-04-10(1213)

2025-04-09(10354)

2025-04-08(12998)

2025-04-07(0)

2025-04-06(0)

2025-04-05(0)

2025-04-04(0)

2025-04-03(0)