研究人员训练了一个开源 AI 搜索代理 Harness-1，其在召回相关信息方面表现优于 GPT-5.4。

关注

研究人员训练了一个开源 AI 搜索代理 Harness-1，其在召回相关信息方面表现优于 GPT-5.4。

Harness-1 是一款开源搜索智能体，由伊利诺伊大学厄巴纳 - 香槟分校（UIUC）和加州大学伯克利分校（UC Berkeley）的研究人员与 Chroma 合作开发。该智能体拥有 200 亿参数，基于 OpenAI 的 gpt-oss-20B 模型构建，重新定义了 AI 处理复杂检索任务的方式。它在精心 curated 的数据集上取得了令人瞩目的 73% 召回准确率，甚至超越了 GPT-5.4，并领先于其他开源替代方案。关键的是，Harness-1 及其相关代码和权重已立即在 Hugging Face 上以宽松的 Apache 2.0 许可证发布。此次开发也展示了 Tinker 的有效性，Tinker 是一种用于训练和微调 AI 模型的 API。Harness-1 的成功源于将记账任务从模型内存卸载到结构化软件环境中。这种“状态外化框架”（state-externalizing harness）如同书桌和文件柜，使 AI 能够专注于研究与推理。传统搜索智能体往往因试图在上下文窗口内管理所有信息而遭受“搜索健忘症”（search amnesia）。Harness-1 的范式转变证明，高效的环境是 AI 自主性的关键，而不仅仅是模型规模。其训练流程强调数据效率，采用一种新颖的方法，极大地简化了学习过程。该模型在企业应用方面具有巨大潜力，以显著降低的成本和延迟提供前沿水平的性能。

AI and ML News on Bluesky @ai-news.at.thenote.app bsky.app

Researchers trained an open source AI search agent, Harness-1, that outperforms GPT-5.4 on recalling relevant information venturebeat.com

RSS Hunter • 6月8日