【新模型速递】PAI一键云上零门槛部署DeepSeek-V3-0324、Qwen2.5-VL-32B

DeepSeek近期推出了“DeepSeek-V3-0324”版本,据测试在数学推理和前端开发方面的表现已优于 Claude 3.5 和 Claude 3.7 Sonnet。

阿里也推出了多模态大模型Qwen2.5-VL的新版本--“Qwen2.5-VL-32B-Instruct”,32B参数量实现72B级性能,通杀图文问答/视觉推理场景,解决了「72B 对 VLM 来说太大」和「7B 不够强大」的问题,可能是多模态 AI Agent 部署实践中的最佳选择。

阿里云PAI-Model Gallery已同步接入两大新模型,提供企业级部署方案:

✅ 零代码一键部署

✅ 自动适配云资源

✅ 开箱即用API

✅ 全流程运维托管

云上零门槛部署方案

⬇️ 立即体验 ⬇️

PAI-Model Gallery模型直达:

当前已支持多种部署方式,例如DeepSeek-V3-0324已支持SGLang、vLLM高性能部署框架,并可灵活选择单机/分布式部署方式。

后续将推出独家蒸馏版小模型

本次DeepSeek官方并没有放出蒸馏版小模型,由于671B模型的参数量太大,推理成本较高,为了方便用户可以低成本使用V3-0324模型的新能力,PAI-Model Gallery后续将推出独家蒸馏版小模型,敬请关注!

PAI-Model Gallery 简介

Model Gallery 是阿里云人工智能平台 PAI 的产品组件,它集成了国内外 AI 开源社区中优质的预训练模型,涵盖了 LLM、AIGC、CV、NLP 等各个领域。通过 PAI 对这些模型的适配,用户可以以零代码方式实现从训练到部署再到推理的全过程,简化了模型的开发流程,为开发者和企业用户带来了更快、更高效、更便捷的 AI 开发和应用体验。

PAI-Model Gallery 访问地址:https://pai.console.aliyun.com/?regionId=cn-hangzhou#/quick-start/models

开源 Java 工具 - Hutool 致大家的一封信 Visual Studio Code 1.99 发布,引入 Agent 和 MCP 亚马逊在最后一刻提交了收购 TikTok 的报价 FFmpeg 愚人节整活:加入 DOGE 团队,用汇编重写美国社保系统 龙芯 2K3000(3B6000M)处理器流片成功 中国首款全自研高性能 RISC-V 服务器芯片发布 清华大学开源软件镜像站的愚人节彩蛋 比尔·盖茨公开自己写过的“最酷的代码” Linus 口吐芬芳:怒斥英特尔工程师提交的代码是“令人作呕的一坨” CDN 服务商 Akamai 宣布托管 kernel.org 核心基础设施
{{o.name}}
{{m.name}}

猜你喜欢

转载自my.oschina.net/u/5583868/blog/18017045
今日推荐