OpenAI 重磅升级 GPT-4o：指令更准、代码更强，超越 GPT-4.5？

群雄逐鹿的 AI 时代，你不进步，就是在后退。

因为，总有人比你更 “卷”。

最近，OpenAI 可谓动作频频。

从最先发布的 GPT-4.5，目前最大参数模型（具体参数量未知），拥有最多的世界级知识，同时也是 OpenAI 最后一个 “非思考” 通用型模型。

到近期开放的 o1-pro 模型 API，o1 系列的高算力版本，也是 OpenAI 当前最强的推理模型，没有之一。

再到前天 OpenAI 重磅推出的基于 GPT-4o 的原生生图功能，相信开通了 ChatGPT 会员的小可爱已经玩 “疯” 了。

它打破了传统 AI 画图工具的各个限制，无限放大了各种创意实现的可能性。

比如，它可以直接召集 “不同朝代的历史人物开个会”。

也可以轻松让 “哆啦A梦和樱桃小丸子合个影”。

然而，OpenAI 的好模型有一个 “通病”。

那就是太贵。

GPT-4.5 和 o1-pro 皆是如此。

GPT-4.5 模型每百万输入、输出 tokens 成本分别为 75、150 美元。o1-pro 的成本更是高达每百万输入、输出 tokens 150、600 美元。

以我个人的一次实际体验为例。我只是随便问了 GPT-4.5 一个很普通的问题，它哐哐哐一通输出。OpenAI 就提醒我 “余额不足，该充值了”。

而反观最近的 “当红炸子鸡” DeepSeek 和谷歌，它们分别推出了各自的新模型 DeepSeek-V3-0324 和 Gemini 2.5 Pro。

然而，这俩模型，一个几乎接近免费，一个是真正的免费。

这让 OpenAI 怎么玩？是我我也急。

于是，OpenAI 出手了。

3 月 28 日凌晨，OpenAI 官宣对 ChatGPT 的基座模型 GPT-4o 进行了升级优化。

总结一下，这次的更新主要包括：

更精准的指令遵循。指令遵循其实是 GPT-4o 的一大强项，从它超强的原生生图能力就能看出来。另外，从这里也能体现出 提示词 的重要性。尤其是复杂任务，你的提示词越精准，AI 回答的质量必然也就越高。
更强的推理和编程能力。这一点和 DeepSeek-V3-0324 非常像，后者的这次更新也是在推理和编程能力显著提高。换句话说，GPT-4o 变得更聪明了。
提高直觉和创造力。模型的直觉指的是 “快速抓住问题的关键”，以及对于模糊问题准确的推断和响应。这一点其实是很关键的。因为多数用户在使用 ChatGPT 不会去精心构思提示词。
更少的表情符号。你感受到 GPT-4o 这几个月以来在回答中加的表情符号变多了吗？这是去年年底 OpenAI 的更新。这次更新给改回去了。

更新后的 GPT-4o 怎么用？

遗憾的是，目前只有 ChatGPT 付费用户可用。免费用户需要再等几周才能体验。

付费用户，如 ChatGPT Plus 和 Pro，在 ChatGPT 里选择 ChatGPT 4o，就能体验到这个新模型了。

那么问题来了，更新后的 GPT-4o 值得用吗？

答案是：很值得。

相较于每周50次使用限制得 GPT-4.5，GPT-4o 的性价比几乎是拉满。

并且，在 LMSYS 大模型排行榜，这个最新的 GPT-4o 0326 已经超越 GPT-4.5 冲到了全榜单的第二名。“风格控制 Style Control” 模式下，综合评分 1359 分，仅次于谷歌的最新推理模型 Gemini 2.5 Pro。要知道，GPT-4o 0326 是一个不会思考的通用模型！

尺有所长，寸有所短。

虽然 OpenAI 官方宣传 GPT-4o 0326 在编程方面有提高，但实测下来，前端页面的设计和代码编写体验还是不如 DeepSeek-V3-0324，更不用说 Claude 3.7 Sonnet。

最后，附上这个我的实测。依旧是经典的 “天气卡片” 编程问题。

相同的提示词，GPT-4o 0326 仅输出了约 200 行代码，并且实际效果远比不上那篇文章里 DeepSeek-V3-0324 的表现。

我是木易，一个专注AI领域的技术产品经理，国内Top2本科+美国Top10 CS硕士。

相信AI是普通人的“外挂”，致力于分享AI全维度知识。这里有最新的AI科普、工具测评、效率秘籍与行业洞察。

欢迎关注“AI信息Gap”，用AI为你的未来加速。

OpenAI 重磅升级 GPT-4o：指令更准、代码更强，超越 GPT-4.5？

精选推荐

目录

精选推荐​​​​​​

猜你喜欢

目录

热门文章

精选推荐