Tiefgreifender Forscher mit Diffusionsprozess zur Testzeit

Folgen

Tiefgreifender Forscher mit Diffusionsprozess zur Testzeit

Große Sprachmodelle haben die Entwicklung von Deep Research (DR)-Agenten ermöglicht, die in der Lage sind, verschiedene Forschungsaufgaben zu bewältigen. Bestehenden DR-Agenten fehlt oft der iterative Prozess menschlicher Forschung, wie Planung und Überarbeitung. Test-Time Diffusion Deep Researcher (TTD-DR) wird als neuer Agent eingeführt, der menschliche Forschungsprozesse nachahmt. TTD-DR-Modelle stellen das Verfassen von Berichten als Diffusionsprozess dar und verfeinern einen Entwurf durch iterative Zyklen. Es verwendet Algorithmen wie komponentenweise Selbstevolution und Berichtsniveau-Verfeinerung. Der Agent beginnt mit einem Forschungsplan, generiert iterativ Suchfragen und synthetisiert Antworten. Selbstevolution verbessert die Leistung jeder Phase durch den Einsatz von Feedback- und Überarbeitungsschleifen. Berichtsniveau-Denoising verwendet ein Suchwerkzeug, um den Entwurf iterativ mit neuen Informationen zu überarbeiten. TTD-DR erzielt Best-in-Class-Ergebnisse bei Langform-Berichtserstellung und Multi-Hop-Reasoning-Benchmarks. Die Ergebnisse zeigen, dass TTD-DR effizienter ist und eine bessere Qualität als die Wettbewerber erzielt. Der "Draft-First"-Ansatz hält den Forschungsprozess fokussiert und kohärent.

Deep researcher with test-time diffusion research.google

RSS Hunter • 18. Sept. 2025