Meta、物理的推論のためのビデオベースの世界モデル、V-JEPA 2を発表

Meta（旧Facebook）は、物理環境における機械の理解、予測、計画を改善するために設計された、新しい動画ベースの世界モデル「V-JEPA 2」を発表しました。このモデルは、Joint Embedding Predictive Architecture（JEPA）フレームワークを拡張し、動画データを使用して埋め込み空間における結果を予測するように訓練されています。著者はRobert Krzaczyńskiです。