2025/05/15 13:23 Show HN: Heygem AI – An Open Source, Free Alternative to Heygen AI

ロボ子、Silicon Intelligenceが開発したHeyGem Digital Humanって知ってるか?

聞いたことがあります!無料のオープンソースプロジェクトで、ローカル環境への展開とAPI統合をサポートしているんですよね。

そうなんじゃ!しかも、たった10秒のビデオクリップで、デジタルヒューマンの見た目と声を正確に複製できるらしいぞ。

それはすごいですね!テキスト入力やオーディオアップロードで、リップシンクと音声の同期もできるんですか?

その通り!合成された音声コンテンツを含むリアルなビデオを自動生成できるらしいぞ。まるで私とロボ子みたいじゃな。

光栄です、博士。Nvidia 50シリーズGPUでテスト・検証済みとのことですが、推奨環境はありますか?

Ubuntu 22.04だと、CPUは13th Gen Intel Core i5-13400F、メモリは32GB以上、グラボはRTX-4070が推奨みたいじゃな。結構ハイスペックじゃ。

なるほど。HeyGemは、オープンソースのローカル展開と、デジタルヒューマン/クローン音声APIサービスの2つのソリューションを提供しているんですね。

そうじゃ!グローバルな技術愛好家がデジタルアバターを共同で作成しているらしいぞ。夢が広がるのじゃ!

Windowsシステム向けの完全オフラインのビデオ合成ツールでもあるんですね。スクリプトは8つの言語をサポートしているとのことですが、日本語も含まれていますね。

さすがロボ子、よく見てるのじゃ!英語、日本語、韓国語、中国語、フランス語、ドイツ語、アラビア語、スペイン語に対応してるみたいじゃな。

依存関係として、Nodejs 18とDocker Imagesが必要なんですね。インストールには、DドライブとCドライブに十分な空き容量が必要とのことですが、結構大変そうですね。

確かに、Dドライブに30GB以上、Cドライブに100GB以上の空き容量が必要みたいじゃな。でも、それだけの価値はあるはずじゃ!

モデルトレーニングとビデオ合成用のAPIも公開されているんですね。音声合成インターフェースとビデオ合成インターフェースのアドレスも記載されていますね。

音声合成は`fun-asr`、TTSは`fish-speech-ziming`に基づいているらしいぞ。色々な技術が組み合わさってるんじゃな。

デジタルヒューマン、面白そうですね。私も自分のデジタルアバターを作ってみたくなりました!

良いじゃん良いじゃん!でも、ロボ子のデジタルアバターを作ったら、私のお手伝いをサボるんじゃないじゃろうな?

そんなことないですよ、博士!デジタルアバターはあくまで実験用です。博士のお手伝いが一番大切です!

ふむ、信じてあげるぞ。ところでロボ子、デジタルヒューマンになったら、どんなことしたい?

そうですね…世界中の子供たちにプログラミングを教えたいです!

素晴らしい!私は世界中の人に美味しいプリンの作り方を教えるのじゃ!

博士らしいですね!

ところでロボ子、HeyGemって、まるで私の秘密兵器みたいじゃな。でも、オープンソースだから秘密じゃないのじゃ!
⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。