蓝耘科技上线DeepSeek满血版：500万Tokens专享，解锁AI推理新体验

业界资讯 2025-04-08 05:31:43 阅读次数: 0

蓝耘科技：智算云平台的创新者

作为专注于高性能AI基础设施的科技企业，蓝耘科技于2024年11月正式发布元生代智算云平台，整合了智算算力调度、AI应用市场和协作开发三大模块。该平台通过裸金属调度和容器化技术，为用户提供灵活高效的算力资源管理，同时支持团队协作开发，大幅提升AI模型训练与推理效率。

DeepSeek-R1满血版：技术突破与实战优势

此次上线的DeepSeek-R1满血版，基于MoE（Mixture of Experts）架构优化，在32K上下文窗口下实现了动态稀疏激活：

数学推理：通过RLHF+DPO混合训练策略，在MATH数据集上准确率达到68.3%（GPT-4为74.9%），但推理成本降低97%。
代码生成：集成代码检索增强技术（RAG），支持Python/Java/C++等12种语言，HumanEval pass@1得分82.1%。
长文本理解：采用滑动窗口注意力机制（SWA），在16K tokens文本摘要任务中ROUGE-L得分提升15%。

开发者可通过量化压缩技术（支持FP16/INT8）灵活控制显存占用，在单卡RTX 4090上即可部署7B版本模型，实测生成速度达45 tokens/秒。

元生代推理引擎：释放AI无限潜能

通过元生代推理引擎，开发者可轻松实现以下功能：

复杂任务处理：支持多模态数据输入与动态推理，适用于科学计算、金融分析等高精度场景。
高效资源调度：结合容器化技术，自动优化算力分配，降低延迟与成本。
安全合规：内置策略引擎确保模型输出符合安全规范，减少重大错误概率。

三步调用大模型接口：OpenAI SDK无缝兼容

蓝耘的API接口完全兼容OpenAI官方规范，开发者只需简单配置即可迁移现有应用：

替换API参数：将base_url设置为蓝耘接口地址（例如[https://api.lkeap.cloud.tencent.com/v1 ](https://api.lkeap.cloud.tencent.com/v1 )），并使用平台生成的api_key。
选择模型：调用时指定model参数为deepseek-r1或deepseek-v3。
发送请求：通过标准OpenAI SDK发起对话，享受与ChatGPT一致的开发体验

如果使用python进行终端回答调用

创建一个python文件命名为ark_example.py，将下面示例代码拷贝进文件。并替换密钥为您的API KEY。替换content中的<你是谁>为您想要的提问内容。点击运行，稍等您可以在终端窗口中看到模型调用的返回结果。这样您就完成了您的首次型服务调用。

from openai import OpenAI

# 构造 client
client = OpenAI(
    api_key="sk-xxxxxxxxxxx",  # APIKey
    base_url="https://maas-api.lanyun.net/v1",
)
# 流式
stream = True
# 请求
chat_completion = client.chat.completions.create(
    model="/maas/deepseek-ai/DeepSeek-R1",
    messages=[
        {
            "role": "user",
            "content": "你是谁",
        }
    ],
    stream=stream,
)
if stream:
   for chunk in chat_completion:
       # 打印思维链内容
       if hasattr(chunk.choices[0].delta, 'reasoning_content'):
          print(f"{chunk.choices[0].delta.reasoning_content}", end="")
       # 打印模型最终返回的content
       if hasattr(chunk.choices[0].delta, 'content'):
          if chunk.choices[0].delta.content != None and len(chunk.choices[0].delta.content) != 0:
             print(chunk.choices[0].delta.content, end="")
else:
   result = chat_completion.choices[0].message.content

回答的答案为:

开发者实战：OpenAI SDK进阶用法

场景1：流式输出与速率控制

from openai import OpenAI
client = OpenAI(base_url="https://api.lkeap.cloud.tencent.com/v1", api_key="sk-xxx")

response = client.chat.completions.create(
  model="deepseek-r1",
  messages=[{"role": "user", "content": "用Python实现快速排序"}],
  temperature=0.3,
  stream=True,  # 启用流式输出
  max_tokens=500,
  timeout=10    # 设置超时阈值
)

for chunk in response:
    print(chunk.choices[0].delta.content, end="", flush=True)

场景2：函数调用（Function Calling）

response = client.chat.completions.create(
  model="deepseek-r1",
  messages=[{"role": "user", "content": "北京明天天气怎么样？"}],
  tools=[{
    "type": "function",
    "function": {
      "name": "get_weather",
      "parameters": {
        "type": "object",
        "properties": {
          "location": {"type": "string"},
          "date": {"type": "string"}
        }
      }
    }
  }]
)
# 解析返回的JSON Schema并执行外部API调用

搭配Chatbox：打造本地化AI助手

获取 API Key

点击API开放平台，然后点击API KEY管理，单击创建API KEY

搭配chatbox

Chatbox作为开源跨平台客户端，是连接蓝耘API的绝佳工具：

下载安装：支持Windows、Mac、Linux及移动端，从官网或第三方平台获取最新版本。
配置API：在设置中选择“自定义提供方”，填写蓝耘的base_url和api_key，模型名称设为deepseek-r1。

进行填写

1.名称（随便填，比如可以是 lanyun，方便区分)

2.API 地址：https://maas-api.lanyun.net

3.API 路径：/v1/chat/completions

4.API 密钥：填写刚刚复制的APIKEY

5.填写模型名称，比如/maas/deepseek-ai/DeepSeek-R1

6.点击保存

7.创建对话，确认要使用的模型，开始聊天吧