GPT-4.5成为AI历史上最贵笑话,全球AI行业泡沫破裂即将倒计时?

人工智能行业正处于巨大的泡沫之中,这句老话已经不必多说,而且已经持续了相当长的时间。几乎每一家AI公司都在亏钱。微软在每位Copilot用户身上亏损,Anthropic在亏损,OpenAI也在巨亏,即时是他们每月收费200美元的专业订阅服务,奥特曼今年1月亲自下场说OpenAI缺钱:

但是我纳闷的是一个月200美元(1500人民币)的订阅费,怎么可能还会亏钱呢?这说明AI行业目前显然是不可持续、不能自给自足的,每家公司都在烧钱进行一场“竞相降价”的战争。

AI泡沫现状:狂热背后的隐忧

我一直在思考AI行业的泡沫究竟何时会破裂。它之所以还没有破灭唯一的原因可能就是是,那些渴望获得巨额回报的、手握巨额资金硅谷投资人还在不断往里砸钱,而且手里的闲钱还没花完!当他们意识到AI行业的发展已经停滞,我认为他们就会停止这场荒谬的融资狂潮,而AI泡沫也将随之破裂。

我觉得我们可能距离这一天已经不远了。AI行业目前面临的三大难题:硬件问题、计算能力不足以及模型坍塌。尽管如此各家模型大厂似乎并没有考虑到这三大难题的风险,却仍在不断扩大模型规模,让它们变得更大、更强。随着即将发布的GPT 4.5,AI行业的薄膜可能终于到达了极限。而GPT 4.5或许就是戳破AI泡沫的那根针。

GPT-4.5与Orion:未来的辉煌还是昙花一现?

今天我们就来回顾一下AI行业是如何走到今天这一步的。当前的AI热潮主要依靠不断扩大模型规模来推动。GPT-1有1.17亿个参数。GPT-2有15亿个参数。GPT-3有1750亿个参数。如今OpenAI并未披露GPT-4的参数数量,但网上很多人推测了它的参数量,大多数猜测大约是1.7万亿个参数。

那么GPT-5会有多少参数呢?GPT-2的参数量大约是GPT-1的12.8倍。GPT-3的参数量又比GPT-2大了大约116.6倍。而GPT-4的参数量可能是GPT-3的9.7倍左右。因此我们可以简单预估GPT-5的参数量将在10倍到100倍之间。为了便于讨论我们假设它的参数量是GPT-4的30倍,即大约51万亿个参数。参数量增长30倍,也意味着成本增加30倍。这一点很有意思,因为OpenAI最近发布了一个比GPT-4o成本高约30倍的模型——GPT-4.5:这让我怀疑GPT-4.5原本可能是计划作为GPT-5推出的,但由于性能差强人意,OpenAI最终将其命名为GPT-4.5。OpenAI甚至有一个为这个模型准备的官方代号叫:Orion,从这里可知它本应该是一款非常强大的模型。

那么,它真的很强大吗?答案是并不!事实上,在OpenAI官方的公告中是这样说的:

GPT-4.5是一个非常庞大且计算密集型的模型,因此它比GPT-4o更昂贵,并且不会取代GPT-4o。因此,我们正在评估是否要在API中长期提供它,同时在支持当前功能和开发未来的模型之间进行平衡。我们期待更多地了解它在现实世界场景使用中的优势、能力和潜在应用。如果GPT-4.5对大家的使用场景提供了独特价值,这些社区的反馈将在我们的决策中发挥重要作用。

公告中的“我们正在评估是否要在API中长期提供它”——这句话并没有给社区和用户们带来太多信心,相信这个模型将会是一个长期支持稳定的模型。

其他人也对GPT-4.5的性能表现感到失望。媒体ArsTechnica称其为“柠檬”(意指质量低劣的产品),并表示“结论已经出来了:OpenAI最新、最强大的传统AI模型GPT-4.5体积庞大、成本高昂且速度慢,其性能相比GPT-4o只提升了很小幅度,但输入成本却高30倍,输出成本高15倍。”另外很多用户和OpenAI社区的开发者等也表达了类似的观点。

不过说实话与GPT-4刚发布时相比,这个模型的价格并没有贵很多。当GPT-4发布时,它并不是按百万输入/输出tokens定价的,而是按千tokens定价的。而且当时有两个版本:一个是8K上下文窗口,另一个是32K上下文窗口。更贵的那个版本,每千输入tokens的成本是6美分,每千输出tokens的成本是12美分。换算下来,相当于每百万输入tokens 60美元,每百万输出tokens 120美元。GPT-4刚发布时价格非常昂贵,这也是为什么很多开发者和企业当时不想在应用中使用它的原因。

如果OpenAI把Orion作为GPT-5发布,我相信它的成本以后也会逐渐下降。他们可能会随后推出GPT-5o,然后再推出GPT-5o mini。但他们为什么没有这样做呢?因为GPT-4发布时,它比GPT-3.5有巨大的提升。还记得这张官方发布的Chatgpt基准测试性能图图吗:

这个提升幅度相对于前一个版本相当的大。但是它确实更贵了,但相比GPT-3.5它带来了显著的性能提升。那么GPT-4.5 Orion呢?他们只展示了这些图表,这让我怀疑GPT-4.5在很多方面并没有超过GPT-4o。而且有趣的是,这些图表的比较模型里并没有包含o3 reasoning模型???只有o3-mini模型。难道要学马斯克Grok3发布会的选择性对比?

GPT-4.5在评测中的优点?

不过至少OpenAI表示GPT-4.5具有更高的“情感智能”,也就是通过AI识别人类情绪的能力。这让我想起了一位AI行业的大佬说过的:笑话,情感智能根本不存在!

此外GPT-4.5在测试中的回应之所以感觉更自然,仅仅是因为他们在微调过程中刻意调整成这样。GPT-3.5也是同样的情况。GPT-4o加入了大量随机的微调,使得它在回答问题时“解释过度”,因为用户喜欢这样。

GPU短缺:AI行业前进路上的拦路虎

在未来OpenAI有可能再发布类似o4的模型,它可能会基于Orion并超过o3。但o系列的思维模型需要额外的大量tokens来进行推理。如果使用Orion进行推理,其成本将会极其昂贵。不仅如此它还会消耗掉OpenAI的所有GPU资源。下面再放上奥特曼原话;

坏消息就是GPT4.5是一款庞大而昂贵的模型。我们本来希望同时向plus和pro用户推出它,但我们最近的增长速度过快,GPU资源已经用尽。下周我们将增加数万块GPU,然后再向plus用户开放。(未来将增加数十万块GPU,而且我确信大家会用光我们能部署的每一块。)

Orion大约比之前的模型大30倍,因此也需要大约30倍数量的GPU。当GPT-4发布时这还不是问题(因为参数没那么夸张),但Nvidia的发货量并未跟上AI市场的增长速度(黄老板得背锅),导致Orion现在受到了GPU限制。看来我得再补充一个AI行业发展停滞的原因:硬件问题、计算能力不足、模型崩溃,现在再加上GPU短缺。

我不知道AI行业接下来会如何发展。OpenAI已经向我们展示了,大规模扩大模型参数量,已经无法带来大幅性能提升。AI行业的“规模扩张红利”正在走向终结,类似于DeepSeek的模型强化学习训练方式。我们可能会看到AI泡沫破裂,并进入另一个AI寒冬。而GPT 4.5或许就是引发这一切的导火索。