研究人员训练了一个开源 AI 搜索代理 Harness-1,其在召回相关信息方面表现优于 GPT-5.4。
Harness-1 是一款开源搜索智能体,由伊利诺伊大学厄巴纳 - 香槟分校(UIUC)和加州大学伯克利分校(UC Berkeley)的研究人员与 Chroma 合作开发。该智能体拥有 200 亿参数,基于 OpenAI 的 gpt-oss-20B 模型构建,重新定义了 AI 处理复杂检索任务的方式。它在精心 curated 的数据集上取得了令人瞩目的 73% 召回准确率,甚至超越了 GPT-5.4,并领先于其他开源替代方案。关键的是,Harness-1 及其相关代码和权重已立即在 Hugging Face 上以宽松的 Apache 2.0 许可证发布。此次开发也展示了 Tinker 的有效性,Tinker 是一种用于训练和微调 AI 模型的 API。Harness-1 的成功源于将记账任务从模型内存卸载到结构化软件环境中。这种“状态外化框架”(state-externalizing harness)如同书桌和文件柜,使 AI 能够专注于研究与推理。传统搜索智能体往往因试图在上下文窗口内管理所有信息而遭受“搜索健忘症”(search amnesia)。Harness-1 的范式转变证明,高效的环境是 AI 自主性的关键,而不仅仅是模型规模。其训练流程强调数据效率,采用一种新颖的方法,极大地简化了学习过程。该模型在企业应用方面具有巨大潜力,以显著降低的成本和延迟提供前沿水平的性能。