就在今天凌晨,OpenAI又有了大动作,发布了一套新工具,旨在帮助构建可靠且强大的AI Agent。
但更重要的是:
OpenAI 开源了!
谁能想到呢,前有DeepSeek,后有Manus,这下有了不得不开源的理由。
那么,为什么呢?
我们先按下不表,先来看看什么是Agent,而OpenAI这次发布了些啥。
一、什么是AI Agent?为什么它这么火?
“Agent”国内通常叫智能体。简单来说,Agent就是一种可以“自己思考、自己行动”的AI工具。
它不像普通的聊天机器人那样只能回答问题,而是能主动完成任务。
比如,你让它帮你订餐厅,它不仅能搜索餐厅信息,还能登录网站、选择时间、完成预订,甚至帮你确认邮件。
就真的是个 “智能的助手”。
不过,Agent的概念虽然火,但真正实现它的技术还面临不少挑战。
比如,Agent需要准确理解任务、避免胡说八道(“AI幻觉”),还需要安全可靠地操作电脑或网络。这些问题正是OpenAI这次新工具试图解决的重点。
就算是号称 “首个通用型Agent” 的Manus,在实测中依旧有很多翻车的情况。
二、OpenAI发布了些啥?
由于Manus最近实在有点火过头了,虽然是吹的和踩的在吵得不可开交,但Agent这条赛道可以说是实打实的火。
本着没人能抢我风头的精神,OpenAI在今天凌晨发布了一套新工具:
1. Responses API
Responses API是一个新API,但并非之前的大模型API,而是一个产品工程的API。
它结合了OpenAI之前两个工具的特点:Chat Completions API(聊天API)和Assistants API(助手API)。
-
Chat Completions API:主要用于简单的对话,比如问ChatGPT问题,它就回答。
-
Assistants API:更高级,能支持工具使用和多轮对话,但操作起来比较复杂。
Responses API则更简单、更强大,支持Agent在一次请求中完成多轮对话、调用多个工具,还能处理图片、视频等多模态输入。
比如,你让Agent分析一张照片并搜索相关信息,Responses API能一次性搞定,不需要用户分步骤操作。
更重要的是,OpenAI计划在2026年第一季度停止支持Assistants API,Responses API将成为开发者构建Agent的“新标配”。
2. 三个内置工具
在Responses API提供了三个内置工具(“built-in tools”),让Agent能像人类一样“行动”:
-
Web search Tool(网络搜索工具)
这个工具让Agent可以实时搜索互联网,确保回答最新、更准确。
比如,你问“今天天气怎么样”,它能直接从网上找到实时数据,而不是依赖过期的训练数据。
在一个叫SimpleQA的测试中,这个工具的表现达到了90%,是目前行业顶尖水平。
-
File search Tool(文件搜索工具)
这个工具适合处理企业里的海量文件,比如公司文档或数据库。
它支持“检索增强生成”(RAG),能快速找到你需要的信息,还能根据元数据(比如文件日期、作者)过滤结果,非常适合企业自动化任务。
-
Computer use Tool(电脑操作工具)
最早是Claude去推行的功能,它让Agent能像人类一样操作电脑,比如打开浏览器、点击按钮、输入文字。
OpenAI推出的“Operator”产品也用到了这个技术,不过目前仅限美区Pro用户使用。
现在开发者也可以通过这个工具实现类似功能,目前这个工具的模型在多个测试中表现优秀,是行业领先水平。
3. Agents SDK
Agents SDK是一个开源框架(没错,这个才是开源的),是之前“Swarm”框架的升级版,专门用来管理单代理和多代理工作流。
-
什么叫多代理工作流? 比如,你有个任务需要搜索信息、分析数据、生成报告,Agents SDK可以分配给不同的Agent完成:一个负责搜索,一个负责分析,最后一个生成报告。
-
它还提供监控和调试功能,比如一个“追踪UI”,让你随时查看代理的工作状态,出了问题也能快速定位。
-
目前Python版已经可以用,Node.js支持预计很快推出。
三、怎么用?
目前直接在OpenAI API平台就能直接调用,不过这玩意的价格并不便宜。
Responses API和Built-in tools的价格详情如下:
1. Responses API的价格
Responses API本身不单独计费,费用直接按照所选择的语言模型的输入和输出令牌(tokens)价格计费。
2. Built-in tools内置工具的价格
内置工具使用时会额外产生费用,具体为:
-
工具:代码解释器 (Code Interpreter)
-
价格:每次会话0.03美元
-
工具:文件搜索存储 (File Search Storage)
-
价格:每天每GB存储0.10美元(每天首个1GB免费)
-
工具:文件搜索调用 (File Search Tool Call)(仅适用于Responses API)
-
价格:每1000次调用2.50美元
-
工具:网络搜索调用 (Web Search Tool Call)
-
价格:根据模型和搜索上下文大小有所不同。
四、OpenAI,被迫Open
最后,为什么说OpenAI是被迫Open呢?
与GPT-4o免费到搜索免费可用一样,这次开源也是一次商业动机十足的举措,更像是市场压力之下,迎合之前“开源”的承诺,对用户,尤其是开发者用户对一次安抚。
因为虽然大家天天嚷嚷AI时代要来,要取代人类了。
但是回过头来大家会发现:
AI,尤其是这些Agent这种有门槛的工具,对普通用户来说,暂时还是有很高门槛的。
所以,OpenAI虽然用户规模达到了十亿级别,但是回过头来看,开发者和企业用户才是自己真正的要争取的人。
普通用户的规模不过是为了讲故事和融资,真正的技术落地和场景应用,还是得有这群孜孜不倦跟随他们的开发者才能帮助他们构建护城河。
尤其是DeepSeek一记重拳下来之后,OpenAI现在很清楚,单纯的技术领先已经不够,开发者生态才是王道。