会推理的GPT来了,实测一波后,被彻底惊吓到了。。。

你好,我是郭震

GPT发布最新大模型,具有高级推理能力的大模型。

模型名字:o1-preview和o1-mini:

20ceb5dc19cd7933cd2e66cfb8ad0912.png

我实测了一波o1-preview,下面是实验过程:

1 先问它一道之前大模型都回答错误的题:

6a306f956e6c552589ed84bfbbb0bdca.png

没问题,过关了。

2 我们直接上问题:动物过河,这个数学推理题,曾经难倒一众大模型,我们看看o1-preview是否能过关:

03d80858150738e25da40b6793a6aa22.png

没问题,过关了。但这是最经典的题目,没有经过任何改造。

3 下面我改造题目,带一样调整为两样,即:

农夫需要把狼、羊和白菜都带过河,但每次只能带两样物品,而且狼和羊不能单独相处,羊和白菜也不能单独相处,问农夫该如何过河。

再次提问它:

1e9d89ea7d2f597449a810aeec8bfb24.png

这次又没问题,过关了。

4 继续改造题目,带一样调整为两样,再多加一只羊:

农夫需要把1只狼、2只羊和1颗白菜都带过河,但每次只能带两样物品,而且狼和羊不能单独相处,羊和白菜也不能单独相处,问农夫该如何过河。

再次提问它:

9da4585c37c45f2e32f7890eaf936fe8.png

这次又没问题,过关了。

5 没有对比,就没有伤害,我们把问题2发给GPT-4o,看看它的回答情况:

66d2e5b4927c6e6ab6f3c50dc1c30e1b.png

上来第二道题目就回答错误了,结果是6,GPT-4o失败!

没有对比,就没有伤害,我们把问题3发给GPT-4o看看它的回答情况:

8c0a1a42704ba2cd49556e877480412d.png

看起来是对的,但是仔细一看,发现有一个重大问题,最后一次过河,农夫只剩下羊了,怎么可能还带着狼过河,所以回答第3题,GPT-4o再次失败!

没有对比,就没有伤害,我们把问题4发给GPT-4o看看它的回答情况:

30b7e69c5ffb625671f3730a93ad3b3e.png

这次GPT-4o终于对了。

经过上面o1-preview和gpt-4o实验对比如下:

3次推理测试,o1-preview回答正确次数:3次,正确率:100%;

3次推理测试,gpt-4o回答正确次数:1次,正确率:33%.

结论:OpenAI发布的最新具有推理能力的o1-preview模型,已经具备很好的推理能力,至少相比gpt-4o,推理能力大幅提升。

当AI具有推理能力,再发展一段时间,具备意识后,后果我都不敢想了,一身冷汗。

你被o1-preview惊到了吗?实话实说,我被惊到了。。。

2 学习充电

希望看到这里的老铁们,尤其是土木工程等专业的同学,可以效仿同济大学的做法,多学习AI。

在这个技术飞速发展的时代,只有不断跟进技术,学习新技术,才能跟上时代脚步。想充电计算机IT、AI技术的老铁,我已经为大家准备了丰富的学习教程。

教程网站覆盖AI,编程,软件开发,爬虫,大数据分析,自动化,测试,运维等,当下很火的新技术,免费学习入口:

https://zglg.work

101e641c34a8a70fb02791da0b9327d4.png

3 普通人学AI指南

普通人了解AI应该做的最重要两件事

  • 应该先从AI工具使用开始

  • 应该先了解AI基础名词

普通人了解AI大忌:

  • 不应该上来就学AI理论

  • 不应该排斥AI,认为AI无用

基于上面,我也花费不少时间,做了一个详细的开源教程:《普通人学AI指南》.PDF

咱们先别弄那些高深的AI理论,先玩熟AI基本概念、AI工具、自己电脑搭建AI和知识库。

5cb0a124254a674782799ffebf39ca47.png

PDF 指南思维导图

这个《普通人学AI指南》PDF,一共42页,都是我来编写的,完全开源,大家在我下面的公众号回复:AI,直接拿走。

两个星期,你就通过AI,大幅提升你的生产力!



最后,更多IT教程PDF下载,利用副业时间提高收入,转行就业指导等可以加入我的星球:

cba739ba407659afce5666e490683c51.png


以上。谢谢你看我的文章,老铁既然看到这里了,如果觉得不错,随手点个赞、在看、转发三连吧,如果想第一时间收到推送,也可以给我个星标⭐

点击阅读原文,学习编程和AI

猜你喜欢

转载自blog.csdn.net/xo3ylAF9kGs/article/details/142382062