Meta stellt V-JEPA 2 vor, ein videobasiertes Weltmodell für physikalische Schlussfolgerungen.

Meta hat V-JEPA 2 vorgestellt, ein neues, video-basiertes Weltmodell, das entwickelt wurde, um das Maschinenverständnis, die Vorhersage und die Planung in physischen Umgebungen zu verbessern. Das Modell erweitert die Joint Embedding Predictive Architecture (JEPA) und ist darauf trainiert, Ergebnisse im Embedding-Raum unter Verwendung von Videodaten vorherzusagen. Von Robert Krzaczyński.