内容提要
OpenAI科学家Noam Brown提出了一个震惊的理论:让AI模型思考20秒带来的性能提升,相当于将模型扩大10万倍并训练10万倍的时间。其中,“系统二思维”是让AI模型性能大幅提升的关键所在,能通过自我对弈等强化学习训练方式提升推理能力。
文章正文
今天凌晨,知名科技媒体Venturebeat消息,OpenAI高级研究科学家、德扑AI之父Noam Brown,在美国旧金山举办的TED AI大会上提出了一个震惊的理论——让AI模型思考 20 秒所带来的性能提升,相当于将模型扩大100,000倍并训练100,000倍的时间。
最初,Brown也被这个结果吓到了,还写了多篇论文来验证其真实性。他发现“系统二思维”( System 2 thinking)才是让AI模型性能大幅度提升的关键所在。而OpenAI最新发布的o1模型同样引入了这个技术概念,并且获得了非常出色的性能提升。
Brown在演讲中表示,过去5年AI能获得巨大提升可以用一个词来概括——规模。但如今的前沿AI模型仍基于 2017年推出的Transformer架构,主要区别在于数据规模和计算能力。
现在是时候进行训练、推理范式转变了,AI模型需要超越单纯的数据预处理,进入 “系统二思维”模式,以一种更慢、更审慎的拟人化推理形式来解决超复杂的难题。
系统二思维介绍
“系统二思维”是一个心理学概念,描述了人类处理复杂问题时所采用的深度思考方式。这个概念最初由心理学家Daniel Kahneman在他的著作《思考,快与慢》中提出,用来解释人类大脑的两种不同的思考模式。
在Kahneman的理论中,系统一思维是快速、直觉、自动的,它处理日常的、熟悉的任务,比如识别熟悉的面孔或者理解简单的句子。
这种思维方式不需要我们有意识地思考,它依赖于我们的直觉和经验,但有时也可能导致错误,因为它不涉及深入的逻辑推理。
而系统二思维则是缓慢、逻辑、努力的,它涉及到深思熟虑、计算和推理。当我们面对复杂的、新颖的或者需要深入分析的问题时,就会启动系统二思维。这种思维方式需要我们集中注意力,消耗更多的认知资源,但它可以帮助我们做出更准确和深思熟虑的决策。
Brown直接将这个概念应用到AI领域,提出了一个革命性的想法:通过模拟人类的系统二思维,AI模型可以在不增加大量数据或计算资源的情况下显著提升性能。
以他开发的战胜人类的德扑AI Libratus为例,仅让AI在每手牌中思考20秒,就能获得与将模型扩大100,000倍相同的性能提升。这种方法的核心在于让AI模型在做出决策前进行更深入的分析和推理,而不是仅仅依赖于大规模数据和计算。
而OpenAI最新发布的o1模型同样引入了系统二思维,能够进行深度推理,模仿人类逐步解决问题的过程,通过自我对弈等强化学习训练方式提升推理能力。
例如,在国际数学奥林匹克资格考试中,o1 模型凭借系统二思维准确推理复杂数学公式取得 83%的准确率,远高于GPT - 4o的13%。这对于金融、医疗、科研、编码等对数据要求严谨的行业来说非常重要。
所以,系统二思维对于增强大模型的能力有很多好处,使其能够更好地适应新的、未见过的任务和环境。在面对错误、不确定性和异常情况时,系统二思维还可以帮助大模型变得更加鲁棒,因为它鼓励模型采取更加谨慎和保守的策略。而在人机交互方面,模拟系统二思维能帮助大模型可以更好地理解和预测人类用户的需求和意图,从而改善交互体验。
能力是GPT-4的100倍!报道:OpenAI计划12月前推出下一代模型“猎户座”
“猎户座”由OpenAI o1的前身“草莓”合成数据开发而成,被视为GPT-4的继任模型,计划较后者实现指数级的改进,核心优势在于处理文本、图像和视频等多模态数据的能力。报道称,猎户座不会通过ChatGPT首发,不确定是否最终命名为GPT-5,微软或最早于11月在Azure云上部署该模型。
“GPT-5”或于年底登场!
周五,据知名科技媒体The Verge报道,OpenAI计划12月前推出下一代模型“猎户座(Orion)”。
此前,据知情人士向The Verge透露,猎户座不会通过ChatGPT首发,OpenAI计划首先向与其密切合作的公司授予访问权限,微软内部的工程师正准备最早于11月在Azure云上部署猎户座模型。
报道补充称,虽然公司内部已将猎户座视为GPT-4的继任模型,但尚不确定猎户座是否将最终命名为GPT-5,发布计划可能会发生变化,也可能会推迟。
“猎户座”强在哪?
猎户座模型由OpenAI o1的前身“草莓”项目合成数据开发而成,最初计划于明年年初推出。
有分析称,草莓和猎户座代表了OpenAI对人工智能未来的愿景。草莓将重新定义推理能力,而猎户座则承诺前所未有的性能改进——二者将共同作为下一代旗舰模型GPT-5的构建块。
具体而言,草莓的核心能力在于强大的推理能力。报告显示,草莓在复杂的数学基准测试中的得分超过90%,处理复杂逻辑问题的能力远超传统推理模型,将其集成到LLM(大语言模型)中可以显著提高AI应用的准确性以及解决问题的能力。
猎户座则是超越GPT-4的下一代大模型,核心优势在于处理文本、图像和视频等多模态数据的能力,其推出有助于OpenAI进一步巩固在大模型领域的领先优势,并为更大规模的应用提供了强大的解决方案,可能彻底改变行业业态。
据悉,猎户座的目标是实现指数级的改进、达到比GPT-4强100倍的能力,将成为大模型在语言处理和多模态功能上实现巨大飞跃的重要里程碑。
此前,OpenAI高管Shaun Ralston在X平台上发文表示,按照计划目标,猎户座的算力将达到GPT-4的100倍,其推出将标志着AI能力的新时代。据悉,OpenAI的终极目标是通过不断迭代构建大模型,最终实现通用人工智能(AGI)。
猎户座的发布也正值OpenAI的关键时刻。据此前报道,OpenAI刚刚完成了66亿美元的历史性融资,估值达1570亿美元。根据本轮融资的协议,OpenAI将在2年内完全重组为一家营利性企业,有望加快公司商业化进程。