【第4章】友達の声を5分録音したら、AIがその声で喋り始めた ── GPT-SoVITSでElevenLabsを捨てた話
Zenn
Share
2026年03月21日AI(その他)

【第4章】友達の声を5分録音したら、AIがその声で喋り始めた ── GPT-SoVITSでElevenLabsを捨てた話

要約・抽出情報

毎月$5〜のAPI代がかかっている。 前回までに作ったAIアバターは、テキスト読み上げにElevenLabsを使っていた。品質は良い。だが、クラウドAPIである以上、レイテンシとコストとカスタマイズの自由度の3つが常に制約になる。 そしてもう一つ。ElevenLabsの声は「借り物」だ。用意されたプリセットか、アップロードした声のクローン。だが、僕が欲しいのは特定の人間の声だ。友達の声で、AIアバターに喋らせたい。 結論から言う。友達に数分間喋ってもらった音声だけで、その声でリアルタイムにテキストを読み上げるシステムが動いた。 完全ローカル。API代ゼロ。RTF 0.25(リアルタイムの...

この記事をシェアする

Share

この記事の詳細はオリジナルサイトでご確認ください

オリジナルサイトで読む