RSS InfoQ

Meta、物理的推論のためのビデオベースの世界モデル、V-JEPA 2を発表

Meta(旧Facebook)は、物理環境における機械の理解、予測、計画を改善するために設計された、新しい動画ベースの世界モデル「V-JEPA 2」を発表しました。このモデルは、Joint Embedding Predictive Architecture(JEPA)フレームワークを拡張し、動画データを使用して埋め込み空間における結果を予測するように訓練されています。著者はRobert Krzaczyńskiです。
favicon
bsky.app
AI and ML News on Bluesky @ai-news.at.thenote.app
favicon
infoq.com
Meta Introduces V-JEPA 2, a Video-Based World Model for Physical Reasoning
Create attached notes ...