在云平台上部署私有化DeepSeek的5种方式对比+成本分析

今年1月,位于杭州的人工智能初创公司DeepSeek发布了一系列先进的大语言模型(LLM),因其卓越的性能、成本效益以及开源特性而在全球的AI社区引起了广泛关注。

DeepSeek提供多个模型,包括2024年12月发布的强大模型DeepSeek-V3。该模型采用创新架构,利用Mixture-of-Experts(MoE)和Multi-Head Latent Attention(MLA)等技术,在降低计算需求的同时实现高AI推理性能,引发了全球AI行业的广泛关注,也打破了Anthropic和OpenAI等巨头对大语言模型领域的垄断。

随后该公司于2025年1月20日推出了专注于推理能力的DeepSeek-R1、DeepSeek-R1-Zero(拥有6710亿参数)以及DeepSeek-R1-Distill(参数规模从1.5亿到700亿不等)。这些模型通过强化学习(RL)等创新训练技术提升推理能力,使其在推理任务上表现出色。

2025年1月27日,DeepSeek进一步推出了基于视觉的Janus-Pro-7B模型。这些模型均已公开发布,并且比同类模型的成本低90%-95%,极具性价比。

外网中DeepSeek不同系列模型的对比图

选择亚马逊云科技作为云平台部署DeepSeek的优势?

增强隐私和安全性

亚马逊云科技通过多种云服务和功能提供强大的隐私和安全保障,使开发者能够在其私有云环境中安全存储数据,并在部署开源模型时确保数据安全。

全面的基础设施支持

亚马逊云科技提供强大的基础设施平台,包括各种配备最新CPU、GPU和为定制化特殊场景加速的Amazon EC2计算实例。此外还提供了行业领先的网络和存储解决方案,以满足不同AI应用的性能和预算需求。

数据基础

亚马逊云科技提供了一套专为存储和搜索优化的向量化数据库服务,例如Amazon OpenSearch、Amazon Aurora PostgreSQL和Amazon RDS PostgreSQL。在生成式AI应用中,数据是关键的性能因素。亚马逊云科技为客户和开发者们提供专用的高性能数据存储,进而提升多种业务场景下的AI应用性能。

如何在亚马逊云科技上私有化部署DeepSeek?

在Amazon Bedrock控制台直接部署DeepSeek-R1模型

大家进入Amazon Bedrock控制台,在左侧导航栏的“Bedrock配置”下选择“开启模型访问权限”。如果想访问由亚马逊云科技完全托管的DeepSeek-R1模型,需要开启DeepSeek的访问权限。获得批准后,即可在Amazon Bedrock上使用DeepSeek-R1模型。

在Amazon Bedrock Marketplace和Amazon SageMaker AI中部署DeepSeek-R1模型

大家可以根据需求选择合适的部署方式,两种部署方式如下:

  • Amazon Bedrock Marketplace适用于希望通过API快速集成现有DeepSeek预训练模型的业务场景。
  • Amazon SageMaker AI适用于对DeepSeek需要深度定制、有自定义训练/微调和部署需求,并有需要管理底层基础设施的业务场景。

a. 在Amazon Bedrock Marketplace部署DeepSeek-R1 - 参考官方文档如何使用Amazon Bedrock Marketplace部署DeepSeek-R1
b. 在Amazon SageMaker JumpStart部署DeepSeek-R1 - 参考官方文档如何使用Amazon SageMaker JumpStart部署DeepSeek-R1

在Amazon Bedrock和Amazon SageMaker AI中部署DeepSeek-R1-Distill模型

DeepSeek-R1-Distill蒸馏模型模型可以通过Amazon Bedrock提供的自定义模型导入(Custom Model Import)进行部署。此外还可以使用AWS Trainium和AWS Inferentia芯片,通过Amazon EC2服务器以更低成本部署Distill模型。大家可以根据如下文档,根据自己的业务场景选择对应的部署方式。

a. 在Amazon Bedrock Marketplace部署DeepSeek-R1-Distill(Llama和Qwen模型) - 请参考官方文档如何使用Amazon Bedrock Marketplace部署DeepSeek-R1-Distill
b. 在Amazon SageMaker JumpStart部署DeepSeek-R1-Distill(Llama和Qwen模型) - 请参考官方文档如何使用Amazon SageMaker JumpStart部署DeepSeek-R1-Distill
c. 在Amazon Bedrock自定义模型导入中部署DeepSeek-R1-Distill(Llama模型) - 请参考官方文档
d. 使用AWS Trainium支持的Amazon EC2 Trn1实例部署DeepSeek-R1-Distill(Llama模型) - 请参考官方文档
e. 通过Hugging Face集成,在Amazon SageMaker AI上训练DeepSeek模型 - 请参考官方文档

在Amazon EC2服务器上部署DeepSeek-V3

参考文档“如何在Amazon EC2上部署DeepSeek-V3”。

在Amazon EC2上部署Janus-Pro-7B

参考文档“如何在Amazon EC2上部署Janus-Pro-7B”。

在亚马逊云科技上部署DeepSeek的成本分析

对于在亚马逊云科技上提供的DeepSeek模型(如DeepSeek-R1)部署成本,成本计费模型有以下不同的方式。

对于Amazon Bedrock Marketplace、Amazon SageMaker Jumpstart和Amazon EC2部署方式,成本按照大家所选推理服务器的使用时长收费,主要是Amazon Bedrock Marketplace、Amazon SageMaker JumpStart和Amazon EC2的基础设施成本。
对于Amazon Bedrock Custom Model Import功能,计费模式采用按需计费,仅按对模型有推理访问的5分钟时间窗口计费(不足5分钟按5分钟计算),每5分钟结算一次。Amazon Bedrock会自动调整扩展和缩减1-3个自定义导入的模型副本,如果有多个模型副本,则成本按照使用副本数量按比例收取。如果5分钟内没有推理访问,Amazon Bedrock会把计算资源自动降为0,极大的降低成本。

对于Amazon Bedrock上全托管的DeepSeek模型,按输入输出的Token数量收费,每1,000个输入tokens为$0.00135,每1,000个输出tokens为$0.0054。

在亚马逊云科技上安全部署DeepSeek大模型最佳实践

使用IAM控制访问

由于DeepSeek-R1通过Marketplace部署,因此可以利用权限管理服务IAM来控制对Bedrock Marketplace模型的访问。例如通过bedrock:CreateMarketplaceModelEndpointbedrock:InvokeModel权限来管理对DeepSeek-R1的访问、推理调用权限。

选择受信任的模型

DeepSeek-R1模型通过Marketplace部署,并采用SafeTensors格式。亚马逊云科技将DeepSeek-R1模型打包为容器,并定期扫描容器以检测并修复漏洞,开发者可以直接通过安全的容器环境直接部署。

实施外部访问屏蔽

在模型部署期间,Amazon Bedrock允许模型在隔离的VPC网络环境中运行,从而阻止任何外部的访问,从而避免来自公网的潜在威胁。

对DeepSeek-R1的访问进行内容审核和过滤

a. DeepSeek-R1等开源模型并非是完全安全的 - 尽管DeepSeek团队打造了一款强大的模型,但安全性并非他们和其他开源模型的主要关注点。Amazon Bedrock在将开源大模型添加到其原生支持的模型列表时,从一开始就构建了完善安全和隐私保护机制。
b. 大家也可以使用Bedrock Guardrails防护栏过滤模型输入和输出
c. 通过使用Guardrails CloudFormation模板可以快速脚本化配置安全策略

总结

本篇文章详细介绍了DeepSeek的最新大模型及其在亚马逊云科技上的部署方案。DeepSeek凭借创新架构和高性价比,在大模型领域开创了全新的低成本部署大模型的方案。通过亚马逊云科技的云平台,企业和开发者们可以安全、高效地部署DeepSeek模型,充分发挥其推理和内容生成能力,同时保障数据安全和隐私,开发高性能的AI应用。