Wie Synthesia mehrere KI-Sprach- und Videomodelle kombiniert, um den Avatar-Realismus mit natürliche

Folgen

Wie Synthesia mehrere KI-Sprach- und Videomodelle kombiniert, um den Avatar-Realismus mit natürlichen Gesten und Erhaltung des Akzents zu verbessern (Rhiannon Williams/MIT Technology Review)

Rhiannon Williams / MIT Technology Review: Wie Synthesia mehrere KI-Sprach- und Videomodelle kombiniert, um den Avatar-Realismus mit natürlichen Gesten und Erhaltung des Akzents zu verbessern – Anfang des Sommers ging ich durch die gläserne Lobby eines schicken Büros in London, in einen Aufzug und dann einen Gang entlang in einen sauberen, mit Teppichboden ausgelegten Raum.

How Synthesia is combining multiple AI voice and video models to improve avatar realism with natural gestures and accent preservation (Rhiannon Williams/MIT Technology Review) techmeme.com

RSS Hunter • 5. Sept. 2025