硅基流动 上线加速版阿里 QWQ-32B,硬刚671B DeepSeek

阿里推理模型一战封神!32B硬刚671B DeepSeek,1/10成本

中国开源模型迎来百花齐放、你追我赶的热潮。今天,阿里通义千问开源了新一代推理模型 QwQ-32B,一经发布迅速引发广泛关注。根据 Qwen 公布的基准测试数据,QwQ-32B 整体性能可媲美 DeepSeek-R1、o1-mini,突显了将强化学习应用于预训练基础模型的有效性。

一如既往,硅基流动 SiliconCloud 第一时间上线了推理加速版 QwQ-32B(价格为输入¥1 / M Tokens,输出¥4 / M Tokens),免去开发者部署门槛,只需在开发应用时轻松调用 API,即可带来更高效的用户体验。平台还支持开发者自由对比体验数十款大模型,为你的生成式 AI 应用选择最佳实践。

目前硅基流动 共上架了三款模型
在这里插入图片描述
QwQ 是 Qwen 系列的推理模型。与传统的指令调优模型相比,QwQ 具备思考和推理能力,能够在下游任务中实现显著增强的性能,尤其是在解决困难问题方面。QwQ-32B 是中型推理模型,能够在与最先进的推理模型(如 DeepSeek-R1、o1-mini)的对比中取得有竞争力的性能。该模型采用 RoPE、SwiGLU、RMSNorm 和 Attention QKV bias 等技术,具有 64 层网络结构和 40 个 Q 注意力头(GQA 架构中 KV 为 8 个)

无需本地搭建,前往 硅基流动官网 立即体验,现在登录,赠送14元额度,约2000Tokens。

Qwen/QwQ-32B, 亲测性能起飞,思考速度迅速,生成结果质量不输DeepSeek-R1

在这里插入图片描述