MIT의 업데이트된 SEAL 기법으로 자기 개선 언어 ... 노트
RSS VentureBeat

MIT의 업데이트된 SEAL 기법으로 자기 개선 언어 모델이 현실이 되고 있습니다.

MIT 연구원들이 ChatGPT와 같은 대규모 언어 모델(LLM)이 스스로를 개선할 수 있도록 하는 새로운 기술인 SEAL을 개발했습니다. SEAL은 LLM이 합성 데이터를 생성하고 자체 미세 조정 전략을 수립하여 자체 적응을 달성할 수 있도록 합니다. 이 방법은 기존 모델과 달리 외부 데이터와 사람이 만든 프로세스에만 의존하지 않습니다. 지난달 공개된 확장된 논문과 오픈 소스 코드는 AI 커뮤니티에서 상당한 주목을 받았습니다. SEAL은 두 개의 루프로 구성됩니다. 내부 루프는 자체 생성된 편집을 사용하여 미세 조정하고, 외부 루프는 강화 학습을 사용하여 편집 생성 정책을 최적화합니다. 지식 통합 및 소수샷 학습 작업에서 성능을 평가한 결과 정확도가 크게 향상되었습니다. 이 기술은 모델이 인간 학습 과정과 유사하게 지식을 통합하기 전에 재구성하는 데 도움이 됩니다. 강력한 결과를 달성했지만, 미세 조정 중 치명적인 망각 가능성과 계산 오버헤드와 같은 과제가 있습니다. 그럼에도 불구하고 SEAL은 높은 유용성의 훈련 데이터를 생성하고 다양한 시나리오에서 일반화하는 능력은 유망합니다. 연구원들은 자체 사전 훈련 및 더 에이전트적인 AI 시스템 개발에 대한 응용을 구상하고 있습니다. 이 작업은 자율적인 LLM 진화를 향한 한 걸음이며, 데이터 제한을 해결하고 개선으로 이어질 수 있습니다.
CdXz5zHNQW_YBrQHHj9O8.png