Meta hat V-JEPA 2 vorgestellt, ein neues, video-basiertes Weltmodell, das entwickelt wurde, um das Maschinenverständnis, die Vorhersage und die Planung in physischen Umgebungen zu verbessern. Das Modell erweitert die Joint Embedding Predictive Architecture (JEPA) und ist darauf trainiert, Ergebnisse im Embedding-Raum unter Verwendung von Videodaten vorherzusagen. Von Robert Krzaczyński.
bsky.app
AI and ML News on Bluesky @ai-news.at.thenote.app
infoq.com
Meta Introduces V-JEPA 2, a Video-Based World Model for Physical Reasoning
