Communauté RSS DEV

MURF AI Hackathon

AudioComic est une application Web qui transforme les PDF de bandes dessinées téléchargés en expériences audio multi-voix entièrement narrées. Il convertit chaque page en image, extrait les dialogues et le contexte de la scène, et synthétise les lignes de caractère à l’aide du TTS et du changeur de voix de Murf AI. L’application tient à jour un résumé de l’histoire pour assurer la fluidité de la narration. Une vidéo de démonstration est disponible sur YouTube, et le référentiel de code est sur GitHub. AudioComic utilise l’API Murf pour la génération audio en temps réel, la prise en charge des voix multilingues, l’attribution dynamique de la voix des personnages, ainsi que le pipeline de traduction et de localisation. L’application rend les bandes dessinées accessibles aux lecteurs malvoyants, aux multitâches, aux éducateurs et aux conteurs. Il simplifie l’adaptation audio des histoires graphiques et ouvre la voie à un nouveau média inclusif. Les plans de développement futurs comprennent une adaptation de style anime, des effets sonores et de la musique immersifs, des effets vidéo et des transitions, ainsi qu’un cadrage précis des panneaux. L’équipe de développement est composée de @kavish2040 et de @nchaudhary. AudioComic a le potentiel de révolutionner la façon dont les gens consomment des bandes dessinées et des histoires graphiques.
favicon
dev.to
MURF AI Hackathon
Image illustrant l'article : MURF AI Hackathon