DeepSeek:极致性价比的AI大模型

1.DeepSeek为什么在春节期间突然这么火?

2025年1月20日,DeepSeek-R1大模型正式发布,刚好赶在春节前,以下特性解释了其大火的主要原因:
(1) 性能与国内外最先进大模型相当,但成本却非常低,有“AI界的拼多多”之称;
(2) 团队只有100多人,还是一家初创公司,却能通过技术创新方式改变行业;
(3) 使用美国出口管制的被阉割的H800显卡训练,缓解了当前AI领域最头疼的算力成本高,缺算力的问题;
(4) 降低对Cuda的依赖,在软件生态上,击穿了英伟达一直以来引以为傲的护城河;
(5) 在人力,算力,财力,时间等都严重紧缺的环境下,研发出高性能低成本的大模型,让国内外那些投入大量资金,花了两三年时间,收效甚微的大厂们汗颜;

2.DeepSeek到底有多火?

(1) 自2025年1月20日DeepSeek-R1模型正式发布以来,18天累计下载量突破1600万,25天内达到4000万,同时登顶苹果App Store和谷歌Play Store全球下载榜首,在全球140个市场中的移动应用下载量排行榜上位居榜首;
(2) 日活用户数突破达2215万,已达到ChatGPT日活跃用户数的41.6%,而ChatGPT是2022年11月就已上线的;
(2) 由于训练成本极低,引发资本市场对高性能显卡需求的担忧,导致1月27日英伟达股票大跌17%;

</

猜你喜欢

转载自blog.csdn.net/qq_38773993/article/details/145575407
今日推荐