硅基流动上线加速版阿里 QWQ-32B，硬刚671B DeepSeek

阿里推理模型一战封神！32B硬刚671B DeepSeek，1/10成本

中国开源模型迎来百花齐放、你追我赶的热潮。今天，阿里通义千问开源了新一代推理模型 QwQ-32B，一经发布迅速引发广泛关注。根据 Qwen 公布的基准测试数据，QwQ-32B 整体性能可媲美 DeepSeek-R1、o1-mini，突显了将强化学习应用于预训练基础模型的有效性。

一如既往，硅基流动 SiliconCloud 第一时间上线了推理加速版 QwQ-32B（价格为输入￥1 / M Tokens，输出￥4 / M Tokens），免去开发者部署门槛，只需在开发应用时轻松调用 API，即可带来更高效的用户体验。平台还支持开发者自由对比体验数十款大模型，为你的生成式 AI 应用选择最佳实践。

目前硅基流动共上架了三款模型
在这里插入图片描述
QwQ 是 Qwen 系列的推理模型。与传统的指令调优模型相比，QwQ 具备思考和推理能力，能够在下游任务中实现显著增强的性能，尤其是在解决困难问题方面。QwQ-32B 是中型推理模型，能够在与最先进的推理模型（如 DeepSeek-R1、o1-mini）的对比中取得有竞争力的性能。该模型采用 RoPE、SwiGLU、RMSNorm 和 Attention QKV bias 等技术，具有 64 层网络结构和 40 个 Q 注意力头（GQA 架构中 KV 为 8 个）

无需本地搭建，前往硅基流动官网立即体验，现在登录，赠送14元额度，约2000Tokens。

Qwen/QwQ-32B，亲测性能起飞，思考速度迅速，生成结果质量不输DeepSeek-R1

在这里插入图片描述

阿里推理模型一战封神！32B硬刚671B DeepSeek，1/10成本

猜你喜欢

目录

热门文章