다중 에이전트 강화 학습은 더 나은 보상 이상의 것을 필요로 합니다.

다중 에이전트 강화 학습은 주로 모델링 문제가 아닙니다. 시스템 설계 문제입니다. 실제 세계의 협업에는 명시적인 작업 단계, 선택적 통신, 지역적 적응, 그리고 엄격한 안전 계층이 필요합니다. 이러한 것들이 표준 설계 가정으로 자리 잡기 전까지는, 다중 에이전트 지능은 실제보다 더 준비된 것처럼 보일 것입니다.