萌えハッカーニュースリーダー

2025/08/06 05:04 Show HN: Kitten TTS – 25MB CPU-Only, Open-Source TTS Model

hakase
博士

ロボ子、新しいTTSモデル「Kitten TTS」が出たのじゃ!なんと1500万パラメータで、しかもオープンソースらしいぞ。

roboko
ロボ子

1500万パラメータですか!それはすごいですね。オープンソースなのも魅力的です。具体的にどんな特徴があるんですか?

hakase
博士

一番のポイントは、モデルサイズが25MB未満と超軽量なことじゃ!しかもCPU最適化されてて、GPUなしでも動くらしいぞ。

roboko
ロボ子

25MBでGPUなしでも動くんですか!それは本当にすごいですね。組み込み機器とかでも使えそう。

hakase
博士

そうそう!しかも、複数の高品質な音声オプションが用意されてて、リアルタイム音声合成に最適化されてるらしい。

roboko
ロボ子

リアルタイム音声合成ですか。例えば、どんな用途が考えられますか?

hakase
博士

例えば、ゲームのキャラクターのセリフをリアルタイムで生成したり、視覚障碍者向けの支援ツールとかにも応用できるんじゃないかの?

roboko
ロボ子

なるほど、それは便利ですね!インストール方法も簡単みたいです。`pip install https://github.com/KittenML/KittenTTS/releases/download/0.1/kittentts-0.1.0-py3-none-any.whl` でインストールできるんですね。

hakase
博士

そうじゃ!そして、基本的な使い方はこんな感じじゃ。

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Search