Wie Synthesia mehrere KI-Sprac... Notiz
RSS Techmeme

Wie Synthesia mehrere KI-Sprach- und Videomodelle kombiniert, um den Avatar-Realismus mit natürlichen Gesten und Erhaltung des Akzents zu verbessern (Rhiannon Williams/MIT Technology Review)

Rhiannon Williams / MIT Technology Review: Wie Synthesia mehrere KI-Sprach- und Videomodelle kombiniert, um den Avatar-Realismus mit natürlichen Gesten und Erhaltung des Akzents zu verbessern – Anfang des Sommers ging ich durch die gläserne Lobby eines schicken Büros in London, in einen Aufzug und dann einen Gang entlang in einen sauberen, mit Teppichboden ausgelegten Raum.