伊隆马斯克和xAI最近发布了他们迄今最先进的AI模型——Grok 3。如果你没看发布会或者不了解Grok3,那么看完这篇文章就能全部了解核心内容!在直播发布会上,Musk自信地称其为“地球上最聪明的AI”。这一说法是否经得起考验,还有待Grok 3和各位开发者们推出的后期观察和深度评测。xAI目前上线了全新的大模型网站,并暂时向所有用户免费开放Grok 3,甚至推出了独立的iOS应用App,让更多人能够体验这一AI模型。那么关于马斯克的Grok 3有哪些有趣的小秘密呢?下面请小李哥为大家一一解密:
- Grok 3上线全新官网
- 发布会中的两位华人
- Grok 3拥有四种模型变体
- 有选择性的基准测试?
- Musk声称Grok 3是地球上最聪明的AI
- Grok 3运行于Colossus超级计算机
- Grok 3在Chatbot Arena排行榜夺冠
- Grok 3在关键基准测试中击败GPT-4o
- Grok 3可用于构建游戏和模拟器
- Grok 3挑战DeepSeek,推出DeepSearch
- xAI推出Grok iOS独立应用
1. 新网站上线
Grok 3即将在全新官网grok.com上线。这个专属平台让用户能够更方便地探索所需要的知识,并与Grok3 AI模型交互。目前,Grok 3暂时对所有用户免费开放。这意味着大家可以在不用注册的情况下,就可以使用Grok 3进行休闲聊天、深入研究某个工作或者学习上的问题,也可以进行图像生成。
2.发布会中的两位华人
发布会上,两位华人科学家分别是:xAI联合创始人吴宇怀(Yuhuai Wu)和多伦多大学计算机科学助理教授吉米·巴(Jimmy Ba)。吉米·巴就是大名鼎鼎的深度学习模型的算法Adam optimizer的开发者,这一个算法的论文引用就高达21W!!!
吴宇怀1995年出生于杭州建德,2015年,吴宇怀以满绩点的成绩,毕业于加拿大纽布伦斯威克大学;2021年,博士毕业于多伦多大学机器学习专业,做过“深度学习之父”杰弗里·辛顿(Geoffrey Hinton)的学生。博士期间,他还曾在谷歌DeepMind和OpenAI实习,此后在谷歌任职并同时在斯坦福做博士后研究。是自训练增强推理模型STAR、语言模型Minerva、定理证明器Alpha Geometry等项目的作者或核心贡献者,在国际顶会发表过诸多论文,比如在《Nature》上发表论文《Solving Olympiad Geometry Without Human Demonstrations》。
3. 四种模型类型版本
Grok 3家族中目前提供四种不同的模型版本,分别如下:
- Grok 3 Base:1.8万亿参数的全规模模型,提供最高精度。
- Grok 3 Mini:4000亿参数版本,响应速度更快。
- Grok 3 Reasoning:采用链式思维架构,专注于复杂问题求解。
- Grok 3 Mini Reasoning:在计算速度和推理深度之间找到平衡点。
每种变体都针对不同的需求和应用场景进行了优化。
4. 有选择的基准测试?
在Grok 3的发布直播中,马斯克在基准测试对比中省略了OpenAI的o3 reasoning模型。。。这意味着如果将o3模型纳入基准测试,Grok 3 Reasoning的排名可能会被取代。这一举动似乎是出于战略考虑,意味着Grok 3仅在某些领域领先于竞争对手OpenAI。
5. 地球上最聪明的AI?
马斯克声称Grok 3是“地球上最聪明的AI”。这一大胆的说法基于该模型在多项评测和发布会演示中的亮眼表现。但Grok3真是世界最强吗?小李哥这里打一个问号,这仍然有待各位进一步深度评测。
6. 模型运行于Colossus超级计算机之上
Grok 3在Colossus超级计算机上运行,该计算机专门在美国孟菲斯建造,专门用于支持Grok3训练和部署。这个超算中心的硬件详情如下:
- 最初使用100,000张Nvidia H100 GPU,后续增加至200,000张。
- 训练过程累计使用超过2亿GPU小时。
这种强大的计算基础设施支撑了Grok 3的 1.8万亿参数架构,规模比Grok 2大10倍。
7. Chatbot Arena性能评测排行榜冠军
Grok 3在LMSYS的Chatbot Arena排行榜上目前排名第一,成为首个 ELO评分超过1400 的AI模型。这一评分超过了GPT-4o(1385) 和Claude 3.5 Sonnet(1372),在对比测试中 72% 的用户更喜欢Grok 3的回答。该模型在物理仿真模拟和解决代码编程的挑战问题中表现尤其出色。
8. 在主流的AI基准测试中击败GPT-4o
在多个主流基准测试中,Grok 3的表现优于GPT-4o,如:
- AIME数学基准测试:Grok 3的准确率达到 92%。
- GPQA科学测试:Grok 3的表现达到了人类 94 分位数水平。
这些测试涵盖从数学到博士级别的科学知识,进一步证明了Grok 3的强大能力。
9. 相对于上一个版本Grok2的巨大提升
马斯克强调Grok 3的快速进步,甚至表示“Grok已经可以上大学了” 。这句话反映了该模型相较于Grok 2有着巨大提升,展现了其陡峭的学习曲线。Grok 3在开发游戏和仿真模拟的能力上也令人印象深刻。在演示过程中Grok 3展示了以下能力:
- 设计了一个 火星-地球轨道转移模拟,可计算最优 Δv(速度增量)。
- 开发了一款融合 俄罗斯方块和宝石迷阵 元素的混合游戏。
- 甚至 生成了3D可打印的量子计算理论部件模型。
这些案例展示了Grok 3的开发和科研潜力,有望在未来革新现实世界中的开发任务和项目。
10. DeepSearch:下一代信息检索技术
Grok 3引入了DeepSearch,这个是一项Grok3全新的AI辅助研究功能。
工作原理:它可以搜索学术论文和社交数据,找到最相关的信息。如果大家听说过 ChatGPT的Deep Research或DeepSeek R-1的Deep Research,Grok 3的DeepSearch功能具备类似的功能。
实际应用:在被问及下一次星舰(Starship)发射时,它能分析127个信息来源,交叉验证轨道力学数据,并提供置信度加权的预测结果。
DeepSearch结合了神经搜索和符号推理,使其成为AI工具箱中的一项独特功能。
11. xAI推出Grok独立iOS手机端应用
随着Grok 3的发布,xAI推出了全新的Grok iOS手机端独立应用。大家现在可以在苹果App Store上下载该应用,适用于 iPhone 和 iPad。如果要切换到Grok 3模型,大家可以按照以下进行操作:
- 打开Grok应用的聊天界面。
- 在顶部的模型选择下拉菜单中,选择Grok 3。之后就可以开始使用了!
结语
以上这就是关于Grok 3发布背后的10个不为人知的细节!目前Grok 3在全球范围内免费使用,小李哥今天才刚刚试了下非常给力,大家可以趁这个机会亲自体验它的强大功能。如果大家还知道其他有趣的Grok 3相关信息,请一定要关注小李哥,不要错过未来更多精彩内容!