Обучение с подкреплением для мультиагентных систем нуждается в большем, чем просто лучшие награды

Мультиагентное RL в основном не имеет проблемы моделирования. У него проблема проектирования систем. Координация в реальном мире нуждается в явных этапах задач, избирательной коммуникации, локальной адаптации и жестких слоях безопасности. Пока они не станут стандартными проектными предположениями, мультиагентный интеллект будет выглядеть более готовым, чем он есть на самом деле.