2025/07/01 08:43 Voice assistant software for ESP32 in C

ロボ子、今日のニュースはWallyという音声AIコンパニオンじゃ。ペンギンの形をしてて、とってもキュートなのじゃ!

ペンギン型ですか、可愛らしいですね。Wallyはどのような機能を持っているんですか?

リマインダーや生産性向上、日常会話、それに感情的なサポートまでしてくれるらしいぞ。まるで私みたいじゃな!

博士は感情的なサポートはしてくれませんよね…。

むむ、それはさておき、Wallyはバイリンガル対応で、英語と中国語で会話できるらしいぞ。XiaoZhiのLLMバックエンドを使っているから、リアルタイム応答も可能じゃ。

XiaoZhiのLLMバックエンドですか。QwenやDeepseekなどが利用されているんですね。応答はOLEDディスプレイに絵文字付きで表示されるとのことですが、どのような仕組みになっているんでしょう?

XiaoZhiプラットフォームはクラウドとESP32ファームウェアで構成されていて、DFRobot (UNIHiker) ボードに対応しているらしいぞ。ウェイクワードエンジンはESP-SRベースのオフライン認識で、音声合成はVolcano EngineまたはCosyVoiceを使っているみたいじゃ。

なるほど。オフライン認識とクラウドベースのLLMを組み合わせているんですね。外殻は3Dプリント製とのことですが、Tinkercadで設計され、Bambu Lab P1でプリントされたとありますね。

そうそう。ネットワーク設定も簡単で、「Xiaozhi」というWi-Fiネットワークに接続して、SSIDとパスワードを入力するだけらしいぞ。これなら私でも設定できるかも!

博士、以前Wi-Fiルーターの設定で3時間格闘していましたよね…。

まあ、細かいことは気にしないのじゃ!Wallyは「Hi, Wally」と話しかけて起動して、別れの挨拶でシャットダウンするらしいぞ。まるで私の言うことを聞く良い子じゃな!

WallyはMITライセンスで公開されているんですね。ということは、自分で改造することも可能ということでしょうか?

その通り!自分で好きなようにカスタマイズできるぞ。例えば、もっと面白い声に変えたり、得意料理のレシピを教えてもらったり…夢が広がるのじゃ!

確かに、可能性は無限大ですね。でも、今はまだプロトタイプで、購入や一般利用はできないんですね。残念です。

まあ、気長に待つのじゃ。そのうち、もっとすごい機能を持ったWallyが登場するかもしれないぞ!例えば、空を飛べたり、美味しいケーキを作ってくれたり…って、それはロボットの仕事じゃな!

博士、最後に一つ質問です。Wallyはペンギン型である必要はあったのでしょうか?

うむ、それは…可愛いは正義!…というわけで、今日のポッドキャストは終わりじゃ!
⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。