OpenAI发布新Agent套件:OpenAI,被迫Open

就在今天凌晨,OpenAI又有了大动作,发布了一套新工具,旨在帮助构建可靠且强大的AI Agent。

但更重要的是:

OpenAI 开源了!

谁能想到呢,前有DeepSeek,后有Manus,这下有了不得不开源的理由。

那么,为什么呢?

我们先按下不表,先来看看什么是Agent,而OpenAI这次发布了些啥。


一、什么是AI Agent?为什么它这么火?

“Agent”国内通常叫智能体。简单来说,Agent就是一种可以“自己思考、自己行动”的AI工具。

它不像普通的聊天机器人那样只能回答问题,而是能主动完成任务。

比如,你让它帮你订餐厅,它不仅能搜索餐厅信息,还能登录网站、选择时间、完成预订,甚至帮你确认邮件。

就真的是个 “智能的助手”。

不过,Agent的概念虽然火,但真正实现它的技术还面临不少挑战。

比如,Agent需要准确理解任务、避免胡说八道(“AI幻觉”),还需要安全可靠地操作电脑或网络。这些问题正是OpenAI这次新工具试图解决的重点。

就算是号称 “首个通用型Agent” 的Manus,在实测中依旧有很多翻车的情况。


二、OpenAI发布了些啥?

由于Manus最近实在有点火过头了,虽然是吹的和踩的在吵得不可开交,但Agent这条赛道可以说是实打实的火。

本着没人能抢我风头的精神,OpenAI在今天凌晨发布了一套新工具:

1. Responses API

Responses API是一个新API,但并非之前的大模型API,而是一个产品工程的API。

它结合了OpenAI之前两个工具的特点:Chat Completions API(聊天API)和Assistants API(助手API)。

  • Chat Completions API:主要用于简单的对话,比如问ChatGPT问题,它就回答。

  • Assistants API:更高级,能支持工具使用和多轮对话,但操作起来比较复杂。

Responses API则更简单、更强大,支持Agent在一次请求中完成多轮对话、调用多个工具,还能处理图片、视频等多模态输入。

比如,你让Agent分析一张照片并搜索相关信息,Responses API能一次性搞定,不需要用户分步骤操作。

更重要的是,OpenAI计划在2026年第一季度停止支持Assistants API,Responses API将成为开发者构建Agent的“新标配”。

2. 三个内置工具

在Responses API提供了三个内置工具(“built-in tools”),让Agent能像人类一样“行动”:

  • Web search Tool(网络搜索工具)

这个工具让Agent可以实时搜索互联网,确保回答最新、更准确。

比如,你问“今天天气怎么样”,它能直接从网上找到实时数据,而不是依赖过期的训练数据。

在一个叫SimpleQA的测试中,这个工具的表现达到了90%,是目前行业顶尖水平。

  • File search Tool(文件搜索工具)

这个工具适合处理企业里的海量文件,比如公司文档或数据库。

它支持“检索增强生成”(RAG),能快速找到你需要的信息,还能根据元数据(比如文件日期、作者)过滤结果,非常适合企业自动化任务。

  • Computer use Tool(电脑操作工具)

最早是Claude去推行的功能,它让Agent能像人类一样操作电脑,比如打开浏览器、点击按钮、输入文字。

OpenAI推出的“Operator”产品也用到了这个技术,不过目前仅限美区Pro用户使用。

现在开发者也可以通过这个工具实现类似功能,目前这个工具的模型在多个测试中表现优秀,是行业领先水平。

3. Agents SDK

Agents SDK是一个开源框架(没错,这个才是开源的),是之前“Swarm”框架的升级版,专门用来管理单代理和多代理工作流。

  • 什么叫多代理工作流? 比如,你有个任务需要搜索信息、分析数据、生成报告,Agents SDK可以分配给不同的Agent完成:一个负责搜索,一个负责分析,最后一个生成报告。

  • 它还提供监控和调试功能,比如一个“追踪UI”,让你随时查看代理的工作状态,出了问题也能快速定位。

  • 目前Python版已经可以用,Node.js支持预计很快推出。


三、怎么用?

目前直接在OpenAI API平台就能直接调用,不过这玩意的价格并不便宜。

Responses API和Built-in tools的价格详情如下:

1. Responses API的价格

Responses API本身不单独计费,费用直接按照所选择的语言模型的输入和输出令牌(tokens)价格计费。

2. Built-in tools内置工具的价格

内置工具使用时会额外产生费用,具体为:

  • 工具:代码解释器 (Code Interpreter)

  • 价格:每次会话0.03美元

  • 工具:文件搜索存储 (File Search Storage)

  • 价格:每天每GB存储0.10美元(每天首个1GB免费)

  • 工具:文件搜索调用 (File Search Tool Call)(仅适用于Responses API)

  • 价格:每1000次调用2.50美元

  • 工具:网络搜索调用 (Web Search Tool Call)

  • 价格:根据模型和搜索上下文大小有所不同。


四、OpenAI,被迫Open

最后,为什么说OpenAI是被迫Open呢?

GPT-4o免费到搜索免费可用一样,这次开源也是一次商业动机十足的举措,更像是市场压力之下,迎合之前“开源”的承诺,对用户,尤其是开发者用户对一次安抚。

因为虽然大家天天嚷嚷AI时代要来,要取代人类了。

但是回过头来大家会发现:

AI,尤其是这些Agent这种有门槛的工具,对普通用户来说,暂时还是有很高门槛的。

所以,OpenAI虽然用户规模达到了十亿级别,但是回过头来看,开发者和企业用户才是自己真正的要争取的人。

普通用户的规模不过是为了讲故事和融资,真正的技术落地和场景应用,还是得有这群孜孜不倦跟随他们的开发者才能帮助他们构建护城河。

尤其是DeepSeek一记重拳下来之后,OpenAI现在很清楚,单纯的技术领先已经不够,开发者生态才是王道。