马斯克Grok 3 AI模型发布大揭秘！11个核心细节全盘解析！

伊隆马斯克和xAI最近发布了他们迄今最先进的AI模型——Grok 3。如果你没看发布会或者不了解Grok3，那么看完这篇文章就能全部了解核心内容！在直播发布会上，Musk自信地称其为“地球上最聪明的AI”。这一说法是否经得起考验，还有待Grok 3和各位开发者们推出的后期观察和深度评测。xAI目前上线了全新的大模型网站，并暂时向所有用户免费开放Grok 3，甚至推出了独立的iOS应用App，让更多人能够体验这一AI模型。那么关于马斯克的Grok 3有哪些有趣的小秘密呢？下面请小李哥为大家一一解密：

Grok 3上线全新官网
发布会中的两位华人
Grok 3拥有四种模型变体
有选择性的基准测试？
Musk声称Grok 3是地球上最聪明的AI
Grok 3运行于Colossus超级计算机
Grok 3在Chatbot Arena排行榜夺冠
Grok 3在关键基准测试中击败GPT-4o
Grok 3可用于构建游戏和模拟器
Grok 3挑战DeepSeek，推出DeepSearch
xAI推出Grok iOS独立应用

1. 新网站上线

Grok 3即将在全新官网grok.com上线。这个专属平台让用户能够更方便地探索所需要的知识，并与Grok3 AI模型交互。目前，Grok 3暂时对所有用户免费开放。这意味着大家可以在不用注册的情况下，就可以使用Grok 3进行休闲聊天、深入研究某个工作或者学习上的问题，也可以进行图像生成。

2.发布会中的两位华人

发布会上，两位华人科学家分别是：xAI联合创始人吴宇怀（Yuhuai Wu）和多伦多大学计算机科学助理教授吉米·巴（Jimmy Ba）。吉米·巴就是大名鼎鼎的深度学习模型的算法Adam optimizer的开发者，这一个算法的论文引用就高达21W！！！

吴宇怀1995年出生于杭州建德，2015年，吴宇怀以满绩点的成绩，毕业于加拿大纽布伦斯威克大学；2021年，博士毕业于多伦多大学机器学习专业，做过“深度学习之父”杰弗里·辛顿（Geoffrey Hinton）的学生。博士期间，他还曾在谷歌DeepMind和OpenAI实习，此后在谷歌任职并同时在斯坦福做博士后研究。是自训练增强推理模型STAR、语言模型Minerva、定理证明器Alpha Geometry等项目的作者或核心贡献者，在国际顶会发表过诸多论文，比如在《Nature》上发表论文《Solving Olympiad Geometry Without Human Demonstrations》。

3. 四种模型类型版本

Grok 3家族中目前提供四种不同的模型版本，分别如下：

Grok 3 Base：1.8万亿参数的全规模模型，提供最高精度。
Grok 3 Mini：4000亿参数版本，响应速度更快。
Grok 3 Reasoning：采用链式思维架构，专注于复杂问题求解。
Grok 3 Mini Reasoning：在计算速度和推理深度之间找到平衡点。

每种变体都针对不同的需求和应用场景进行了优化。

4. 有选择的基准测试？

在Grok 3的发布直播中，马斯克在基准测试对比中省略了OpenAI的o3 reasoning模型。。。这意味着如果将o3模型纳入基准测试，Grok 3 Reasoning的排名可能会被取代。这一举动似乎是出于战略考虑，意味着Grok 3仅在某些领域领先于竞争对手OpenAI。

5. 地球上最聪明的AI？

马斯克声称Grok 3是“地球上最聪明的AI”。这一大胆的说法基于该模型在多项评测和发布会演示中的亮眼表现。但Grok3真是世界最强吗？小李哥这里打一个问号，这仍然有待各位进一步深度评测。

6. 模型运行于Colossus超级计算机之上

Grok 3在Colossus超级计算机上运行，该计算机专门在美国孟菲斯建造，专门用于支持Grok3训练和部署。这个超算中心的硬件详情如下：

最初使用100,000张Nvidia H100 GPU，后续增加至200,000张。
训练过程累计使用超过2亿GPU小时。

这种强大的计算基础设施支撑了Grok 3的 1.8万亿参数架构，规模比Grok 2大10倍。

7. Chatbot Arena性能评测排行榜冠军

Grok 3在LMSYS的Chatbot Arena排行榜上目前排名第一，成为首个 ELO评分超过1400 的AI模型。这一评分超过了GPT-4o（1385）和Claude 3.5 Sonnet（1372），在对比测试中 72% 的用户更喜欢Grok 3的回答。该模型在物理仿真模拟和解决代码编程的挑战问题中表现尤其出色。

8. 在主流的AI基准测试中击败GPT-4o

在多个主流基准测试中，Grok 3的表现优于GPT-4o，如：

AIME数学基准测试：Grok 3的准确率达到 92%。
GPQA科学测试：Grok 3的表现达到了人类 94 分位数水平。

这些测试涵盖从数学到博士级别的科学知识，进一步证明了Grok 3的强大能力。

9. 相对于上一个版本Grok2的巨大提升

马斯克强调Grok 3的快速进步，甚至表示“Grok已经可以上大学了” 。这句话反映了该模型相较于Grok 2有着巨大提升，展现了其陡峭的学习曲线。Grok 3在开发游戏和仿真模拟的能力上也令人印象深刻。在演示过程中Grok 3展示了以下能力：

设计了一个火星-地球轨道转移模拟，可计算最优 Δv（速度增量）。
开发了一款融合俄罗斯方块和宝石迷阵元素的混合游戏。
甚至生成了3D可打印的量子计算理论部件模型。

这些案例展示了Grok 3的开发和科研潜力，有望在未来革新现实世界中的开发任务和项目。

10. DeepSearch：下一代信息检索技术

Grok 3引入了DeepSearch，这个是一项Grok3全新的AI辅助研究功能。

工作原理：它可以搜索学术论文和社交数据，找到最相关的信息。如果大家听说过 ChatGPT的Deep Research或DeepSeek R-1的Deep Research，Grok 3的DeepSearch功能具备类似的功能。

实际应用：在被问及下一次星舰（Starship）发射时，它能分析127个信息来源，交叉验证轨道力学数据，并提供置信度加权的预测结果。

DeepSearch结合了神经搜索和符号推理，使其成为AI工具箱中的一项独特功能。

11. xAI推出Grok独立iOS手机端应用

随着Grok 3的发布，xAI推出了全新的Grok iOS手机端独立应用。大家现在可以在苹果App Store上下载该应用，适用于 iPhone 和 iPad。如果要切换到Grok 3模型，大家可以按照以下进行操作：

打开Grok应用的聊天界面。
在顶部的模型选择下拉菜单中，选择Grok 3。之后就可以开始使用了！

结语

以上这就是关于Grok 3发布背后的10个不为人知的细节！目前Grok 3在全球范围内免费使用，小李哥今天才刚刚试了下非常给力，大家可以趁这个机会亲自体验它的强大功能。如果大家还知道其他有趣的Grok 3相关信息，请一定要关注小李哥，不要错过未来更多精彩内容！