腾讯云HAI部署DeepSeek结合Ollama API搭建智能对话系统

前言

本文将详细介绍如何在腾讯云HAI平台上部署DeepSeek模型，并配置使用Ollama API服务以实现对外部请求的支持。通过对前期准备、部署流程、API服务配置及使用的详细阐述，希望能为读者提供一个全面且实用的指南，助力AI应用的高效开发和部署。

一、腾讯云 HAI 部署 DeepSeek 详细教程

下面我们将详细介绍如何在腾讯云 HAI 上部署 DeepSeek 模型，即使是没有深厚技术背景的小白，也能按照以下步骤轻松完成部署。

（一）注册与登录腾讯云

打开浏览器，访问腾讯云官网（https://cloud.tencent.com/ ）。

请在此添加图片描述

点击页面右上角的 “免费注册” 按钮，按照提示填写相关信息，完成腾讯云账号的注册。注册过程中，需要提供有效的手机号码或邮箱，用于接收验证码和账号相关信息。

注册成功后，返回腾讯云官网首页，点击 “登录” 按钮，使用刚刚注册的账号登录腾讯云控制台。

（二）进入腾讯云 HAI 控制台

登录腾讯云控制台后，在页面上方的搜索框中输入 “HAI”，然后在搜索结果中点击 “高性能应用服务 HAI”，进入腾讯云 HAI 服务页面。

请在此添加图片描述

（三）新建 HAI 应用

在 HAI 服务页面中，点击 “新建” 按钮，进入新建应用页面。

请在此添加图片描述

1. 选择应用

在应用列表中，切换到 “社区应用” 标签页，找到 “deepseek-r1:7b” 选项并选择。该模型适用于多种自然语言处理任务，如文本生成、问答系统、机器翻译等。

请在此添加图片描述

2. 计费模式

根据自己的使用需求选择计费方式，若只是测试使用，建议选择按量计费，使用完成后及时关闭实例，可节省成本；若有长期稳定的使用需求，可考虑包月计费。

请在此添加图片描述

3. 地域选择

根据自己所在的城市或网络情况，就近选择地域，这样可以降低网络延迟，提高访问速度。例如，如果您在北京地区，可选择 “北京” 地域。

请在此添加图片描述

4. 算力方案

根据模型的运行需求和预算选择合适的算力方案，如 GPU 基础型、GPU 进阶型等。GPU 基础型适用于一般的测试和小型应用场景，成本较低；GPU 进阶型则提供更高的算力和显存，适用于大规模模型训练和高并发的推理场景，但费用相对较高。对于初次体验 DeepSeek 模型的用户，GPU 基础型通常可以满足基本需求。

请在此添加图片描述

5. 云硬盘

默认提供 200GB 的免费空间，可根据实际使用需求进行调整。如果需要存储大量的数据或模型文件，可适当增加云硬盘的容量。

6. 设置实例名称

为新建的实例设置一个易于识别的名称，方便后续管理和识别。例如，命名为 “deepseek-r1:7b-Yue”。

请在此添加图片描述

确认所有配置信息无误后，勾选相关协议，然后点击 “立即购买” 按钮。

（四）等待实例创建完成

点击 “立即购买” 后，系统开始创建 deepseek-r1:7b 实例，页面会显示 “创建中” 状态。这个过程通常需要几分钟时间，具体时间取决于所选的算力方案和当前腾讯云的资源情况。

请在此添加图片描述

您可以在 HAI 服务页面的实例列表中，实时查看实例的创建进度。当状态变为 “运行中” 时，表示实例创建成功，可以开始使用。

请在此添加图片描述

二、Ollama 服务基本原理

Ollama 是一个开源的大型语言模型（LLM）运行框架，旨在简化在本地环境中运行和管理大型语言模型的流程。它支持多种流行的语言模型（如 LLaMA 2、Mistral、Phi-3 等），并提供简单的命令行界面，使用户能够快速下载、配置和运行模型。

（一）模型管理与组织

1. 模型存储

Ollama会将从外部获取（如通过其提供的命令下载）的各种大型语言模型（如LLaMA 2、Mistral、Phi - 3等）存储在本地特定的目录结构中。这些模型包含预训练的神经网络权重、配置文件等相关数据。
它对模型进行分类管理，以便能够快速定位和调用不同的模型。

2. 版本控制

能够识别不同版本的模型。当有新的模型版本发布或者用户手动切换模型版本时，Ollama可以根据版本标识准确地加载相应的模型文件。

（二）交互接口（API）原理

1. RESTful架构遵循

Ollama服务基于RESTful API设计原则构建其交互接口。这意味着它使用标准的HTTP方法（如GET、POST、PUT、DELETE等）来执行不同的操作。
例如，通常使用POST方法来发送包含输入数据（如提示词等）的请求到服务器，以触发模型的推理操作。

2. 端点定义

定义了一系列特定的API端点，每个端点对应一种功能。比如“/api/generate”端点用于根据给定的提示生成文本，“/api/chat”端点用于处理对话模式的交互。
这些端点接受特定格式的JSON数据作为输入，其中包含诸如模型名称、输入文本&

前言

一、腾讯云 HAI 部署 DeepSeek 详细教程

（一）注册与登录腾讯云

（二）进入腾讯云 HAI 控制台

（三）新建 HAI 应用

1. 选择应用

2. 计费模式

3. 地域选择

4. 算力方案

5. 云硬盘

6. 设置实例名称

（四）等待实例创建完成

二、Ollama 服务基本原理

（一）模型管理与组织

1. 模型存储

2. 版本控制

（二）交互接口（API）原理

1. RESTful架构遵循

2. 端点定义

猜你喜欢

目录

热门文章