テスト時の拡散を利用した深層研究者
大規模言語モデルは、様々な研究タスクを実行できる深層研究(DR)エージェントの開発を可能にしました。既存のDRエージェントは、計画や修正といった人間の研究に見られる反復的なプロセスを欠いていることがよくあります。Test-Time Diffusion Deep Researcher(TTD-DR)は、人間の研究プロセスを模倣する新しいエージェントとして導入されました。TTD-DRモデルは、レポート作成を拡散プロセスとして捉え、反復的なサイクルを通じて草稿を洗練させます。コンポーネントごとの自己進化やレポートレベルの洗練といったアルゴリズムを使用します。エージェントは研究計画から始め、反復的に検索質問を生成し、回答を統合します。自己進化は、フィードバックと修正ループを使用することで、各段階のパフォーマンスを向上させます。レポートレベルのノイズ除去は、検索ツールを使用して、新しい情報で草稿を反復的に修正します。TTD-DRは、長文レポート作成とマルチホップ推論のベンチマークで、最先端の結果を達成しています。結果は、TTD-DRが競合他社よりも効率的で、より高品質であることを示しています。「草稿ファースト」のアプローチは、研究プロセスを集中させ、一貫性を保ちます。