AudioComicは、ウェブアプリケーションで、アップロードされたコミックのPDFを、完全にナレーションされた、マルチボイスのオーディオ体験に変換します。各ページを画像に変換し、ダイアログとシーンのコンテキストを抽出し、Murf AIのTTSとボイスチェンジャーを使用してキャラクターの台詞を合成します。アプリケーションは、ストーリーの流れを確保するために、ストーリーの要約を維持しています。デモビデオはYouTubeで、コードリポジトリはGitHubにあります。AudioComicは、Murf APIを使用してリアルタイムのオーディオ生成、マルチ言語のボイスサポート、ダイナミックなキャラクターボイスの割り当て、翻訳およびローカライズのパイプラインを実現しています。このアプリケーションは、視覚的に不自由な読者、多タスク者、教育者、ストーリーテラーにコミックをアクセシブルにします。また、グラフィックストーリーのオーディオアダプテーションを簡略化し、新しい包括的なメディアを開きます。将来的には、アニメ風アダプテーション、イミュージョンサウンドエフェクトとミュージック、ビデオエフェクトとトランジション、プレシジョンパネルタイミングを計画しています。開発チームは、@kavish2040と@nchaudharyで構成されています。AudioComicは、コミックとグラフィックストーリーの消費方法を革命的に変える可能性があります。
dev.to
MURF AI Hackathon
Create attached notes ...