Мы представляем BYOL-Explore, концептуально простой, но общий подход для любопытного исследования в визуально сложных средах. BYOL-Explore обучает представление мира, динамику мира и политику исследования одновременно, оптимизируя одну предсказательную потерю в латентном пространстве без дополнительных вспомогательных целей. Мы показываем, что BYOL-Explore эффективен в DM-HARD-8, сложном частично наблюдаемом непрерывном действии hard-exploration бенчмарке с визуально богатыми 3D-средами.
deepmind.google
BYOL-Explore: Exploration with Bootstrapped Prediction
