官方介绍:https://huggingface.co/blog/open-deep-research
Github:https://github.com/huggingface/smolagents/tree/gaia-submission-r1/examples/open_deep_research
在线体验:https://m-ric-open-deep-research.hf.space/
以下是对官方原文进行的翻译:
昨天,OpenAI 发布了 Deep Research,这是一个通过浏览网页来总结内容并根据总结回答问题的系统。这个系统令人印象深刻,我们第一次尝试时就被震撼了。
博客文章中的主要结果之一是在通用人工智能助手基准(GAIA) 上的性能有了显着提升,这也是我们最近一直在使用的基准,它们平均一次性成功获得近67% 的正确答案,在特别具有挑战性的涉及多步骤推理和工具使用的“3 级”问题上,正确率达到47.6%(有关GAIA 的介绍见下文)。
DeepResearch 由一个 LLM(可从 OpenAI、4o、o1、o3 等提供的当前 LLM 列表中选择)和一个内部“代理框架”组成,该框架指导 LLM 使用网络搜索等工具并分步组织其操作。
虽然功能强大的 LLM 现在已可在开源系统中免费获取(例如参见 最近的 DeepSeek R1 模型),但 OpenAI 并未透露太多有关 Deep Research 背后的代理框架的信息……
因此,我们决定开展一项 24 小时的任务来重现他们的结果,并在此过程中开源所需的框架!