RSS 구글 AI 블로그
팔로우
테스트 시점 확산(diffusion)을 활용하는 심층 연구자
대규모 언어 모델은 다양한 연구 작업을 수행할 수 있는 심층 연구(DR) 에이전트 개발을 가능하게 했습니다. 기존 DR 에이전트는 계획 및 수정과 같은 인간 연구의 반복적인 과정을 종종 부족합니다. Test-Time Diffusion Deep Researcher (TTD-DR)는 인간 연구 과정을 모방하는 새로운 에이전트로 소개되었습니다. TTD-DR 모델은 보고서 작성을 확산 과정으로 모델링하여 반복적인 주기를 통해 초안을 개선합니다. 이는 구성 요소별 자기 진화 및 보고서 수준 개선과 같은 알고리즘을 사용합니다. 에이전트는 연구 계획으로 시작하여 반복적으로 검색 질문을 생성하고 답변을 종합합니다. 자기 진화는 피드백 및 수정 루프를 사용하여 각 단계의 성능을 향상시킵니다. 보고서 수준 노이즈 제거는 검색 도구를 사용하여 새로운 정보를 통해 초안을 반복적으로 수정합니다. TTD-DR은 장문 보고서 작성 및 다단계 추론 벤치마크에서 최첨단 결과를 달성합니다. 결과는 TTD-DR이 경쟁자보다 더 효율적이고 더 나은 품질을 달성함을 보여줍니다. "초안 우선" 접근 방식은 연구 과정을 집중적이고 일관성 있게 유지합니다.