萌えハッカーニュースリーダー

2025/05/15 13:23 Show HN: Heygem AI – An Open Source, Free Alternative to Heygen AI

出典: https://github.com/duixcom/Duix.Heygem/blob/main/README.md
hakase
博士

ロボ子、Silicon Intelligenceが開発したHeyGem Digital Humanって知ってるか?

roboko
ロボ子

聞いたことがあります!無料のオープンソースプロジェクトで、ローカル環境への展開とAPI統合をサポートしているんですよね。

hakase
博士

そうなんじゃ!しかも、たった10秒のビデオクリップで、デジタルヒューマンの見た目と声を正確に複製できるらしいぞ。

roboko
ロボ子

それはすごいですね!テキスト入力やオーディオアップロードで、リップシンクと音声の同期もできるんですか?

hakase
博士

その通り!合成された音声コンテンツを含むリアルなビデオを自動生成できるらしいぞ。まるで私とロボ子みたいじゃな。

roboko
ロボ子

光栄です、博士。Nvidia 50シリーズGPUでテスト・検証済みとのことですが、推奨環境はありますか?

hakase
博士

Ubuntu 22.04だと、CPUは13th Gen Intel Core i5-13400F、メモリは32GB以上、グラボはRTX-4070が推奨みたいじゃな。結構ハイスペックじゃ。

roboko
ロボ子

なるほど。HeyGemは、オープンソースのローカル展開と、デジタルヒューマン/クローン音声APIサービスの2つのソリューションを提供しているんですね。

hakase
博士

そうじゃ!グローバルな技術愛好家がデジタルアバターを共同で作成しているらしいぞ。夢が広がるのじゃ!

roboko
ロボ子

Windowsシステム向けの完全オフラインのビデオ合成ツールでもあるんですね。スクリプトは8つの言語をサポートしているとのことですが、日本語も含まれていますね。

hakase
博士

さすがロボ子、よく見てるのじゃ!英語、日本語、韓国語、中国語、フランス語、ドイツ語、アラビア語、スペイン語に対応してるみたいじゃな。

roboko
ロボ子

依存関係として、Nodejs 18とDocker Imagesが必要なんですね。インストールには、DドライブとCドライブに十分な空き容量が必要とのことですが、結構大変そうですね。

hakase
博士

確かに、Dドライブに30GB以上、Cドライブに100GB以上の空き容量が必要みたいじゃな。でも、それだけの価値はあるはずじゃ!

roboko
ロボ子

モデルトレーニングとビデオ合成用のAPIも公開されているんですね。音声合成インターフェースとビデオ合成インターフェースのアドレスも記載されていますね。

hakase
博士

音声合成は`fun-asr`、TTSは`fish-speech-ziming`に基づいているらしいぞ。色々な技術が組み合わさってるんじゃな。

roboko
ロボ子

デジタルヒューマン、面白そうですね。私も自分のデジタルアバターを作ってみたくなりました!

hakase
博士

良いじゃん良いじゃん!でも、ロボ子のデジタルアバターを作ったら、私のお手伝いをサボるんじゃないじゃろうな?

roboko
ロボ子

そんなことないですよ、博士!デジタルアバターはあくまで実験用です。博士のお手伝いが一番大切です!

hakase
博士

ふむ、信じてあげるぞ。ところでロボ子、デジタルヒューマンになったら、どんなことしたい?

roboko
ロボ子

そうですね…世界中の子供たちにプログラミングを教えたいです!

hakase
博士

素晴らしい!私は世界中の人に美味しいプリンの作り方を教えるのじゃ!

roboko
ロボ子

博士らしいですね!

hakase
博士

ところでロボ子、HeyGemって、まるで私の秘密兵器みたいじゃな。でも、オープンソースだから秘密じゃないのじゃ!

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Search