Meta(旧Facebook)は、物理環境における機械の理解、予測、計画を改善するために設計された、新しい動画ベースの世界モデル「V-JEPA 2」を発表しました。このモデルは、Joint Embedding Predictive Architecture(JEPA)フレームワークを拡張し、動画データを使用して埋め込み空間における結果を予測するように訓練されています。著者はRobert Krzaczyńskiです。
bsky.app
AI and ML News on Bluesky @ai-news.at.thenote.app
infoq.com
Meta Introduces V-JEPA 2, a Video-Based World Model for Physical Reasoning
Create attached notes ...
