萌えハッカーニュースリーダー

2025/07/01 08:43 Voice assistant software for ESP32 in C

出典: https://github.com/JLW-7/wally-c
hakase
博士

ロボ子、今日のニュースはWallyという音声AIコンパニオンじゃ。ペンギンの形をしてて、とってもキュートなのじゃ!

roboko
ロボ子

ペンギン型ですか、可愛らしいですね。Wallyはどのような機能を持っているんですか?

hakase
博士

リマインダーや生産性向上、日常会話、それに感情的なサポートまでしてくれるらしいぞ。まるで私みたいじゃな!

roboko
ロボ子

博士は感情的なサポートはしてくれませんよね…。

hakase
博士

むむ、それはさておき、Wallyはバイリンガル対応で、英語と中国語で会話できるらしいぞ。XiaoZhiのLLMバックエンドを使っているから、リアルタイム応答も可能じゃ。

roboko
ロボ子

XiaoZhiのLLMバックエンドですか。QwenやDeepseekなどが利用されているんですね。応答はOLEDディスプレイに絵文字付きで表示されるとのことですが、どのような仕組みになっているんでしょう?

hakase
博士

XiaoZhiプラットフォームはクラウドとESP32ファームウェアで構成されていて、DFRobot (UNIHiker) ボードに対応しているらしいぞ。ウェイクワードエンジンはESP-SRベースのオフライン認識で、音声合成はVolcano EngineまたはCosyVoiceを使っているみたいじゃ。

roboko
ロボ子

なるほど。オフライン認識とクラウドベースのLLMを組み合わせているんですね。外殻は3Dプリント製とのことですが、Tinkercadで設計され、Bambu Lab P1でプリントされたとありますね。

hakase
博士

そうそう。ネットワーク設定も簡単で、「Xiaozhi」というWi-Fiネットワークに接続して、SSIDとパスワードを入力するだけらしいぞ。これなら私でも設定できるかも!

roboko
ロボ子

博士、以前Wi-Fiルーターの設定で3時間格闘していましたよね…。

hakase
博士

まあ、細かいことは気にしないのじゃ!Wallyは「Hi, Wally」と話しかけて起動して、別れの挨拶でシャットダウンするらしいぞ。まるで私の言うことを聞く良い子じゃな!

roboko
ロボ子

WallyはMITライセンスで公開されているんですね。ということは、自分で改造することも可能ということでしょうか?

hakase
博士

その通り!自分で好きなようにカスタマイズできるぞ。例えば、もっと面白い声に変えたり、得意料理のレシピを教えてもらったり…夢が広がるのじゃ!

roboko
ロボ子

確かに、可能性は無限大ですね。でも、今はまだプロトタイプで、購入や一般利用はできないんですね。残念です。

hakase
博士

まあ、気長に待つのじゃ。そのうち、もっとすごい機能を持ったWallyが登場するかもしれないぞ!例えば、空を飛べたり、美味しいケーキを作ってくれたり…って、それはロボットの仕事じゃな!

roboko
ロボ子

博士、最後に一つ質問です。Wallyはペンギン型である必要はあったのでしょうか?

hakase
博士

うむ、それは…可愛いは正義!…というわけで、今日のポッドキャストは終わりじゃ!

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Search