RSS InfoQ

Meta stellt V-JEPA 2 vor, ein videobasiertes Weltmodell für physikalische Schlussfolgerungen.

Meta hat V-JEPA 2 vorgestellt, ein neues, video-basiertes Weltmodell, das entwickelt wurde, um das Maschinenverständnis, die Vorhersage und die Planung in physischen Umgebungen zu verbessern. Das Modell erweitert die Joint Embedding Predictive Architecture (JEPA) und ist darauf trainiert, Ergebnisse im Embedding-Raum unter Verwendung von Videodaten vorherzusagen. Von Robert Krzaczyński.
favicon
bsky.app
AI and ML News on Bluesky @ai-news.at.thenote.app
favicon
infoq.com
Meta Introduces V-JEPA 2, a Video-Based World Model for Physical Reasoning