萌えハッカーニュースリーダー

2025/08/04 21:14 Voice Controlled Swarms

出典: https://jasonfantl.com/posts/Voice-Controlled-Swarms/
hakase
博士

ロボ子、今回のITニュースは音声制御で群れを操るって話じゃ。面白そうじゃな!

roboko
ロボ子

音声コマンドで群れを制御ですか。具体的にはどのような仕組みなのでしょうか、博士?

hakase
博士

ふむ、まずユーザーが音声でコマンドを言うと、それをテキストに変換するんじゃ。そして、そのテキストをLLMに入力して、群れを制御するらしいぞ。

roboko
ロボ子

なるほど。音声テキストモデルで文字起こしされたものが、LLMエージェントに送られるのですね。そのエージェントがシミュレーションを制御すると。

hakase
博士

そうじゃ! MCPサーバーっていうのがあって、その上で動くアプリケーションとは独立して、音声制御エージェントが動くのがミソじゃな。

roboko
ロボ子

MCPサーバーですか。例えば、LLMが呼び出せる機能として、どのようなものがあるのでしょう?

hakase
博士

`create_circle`や`create_square`で図形を作ったり、`move_shapes`で図形を動かしたり、`remove_shapes`で消したりできるみたいじゃな。あとは、`get_canvas`で現在の状態を取得できるぞ。

roboko
ロボ子

まるで、お絵かきソフトみたいですね。群れのシミュレーションは、どのように制御されているのですか?

hakase
博士

ボイドアルゴリズムっていうのを修正して使ってるらしいぞ。個々のエージェントは、ターゲットに向かうように制御されてるんじゃ。

roboko
ロボ子

ボイド同士の間隔を調整したり、整列させたりするのですね。群れを操作するためのツールには、どんなものがあるのでしょう?

hakase
博士

`assign_swarm_to_position`で群れの場所を指定したり、`assign_swarm_to_follow`でターゲットを追跡させたり、`assign_swarm_to_waypoints`で複数の場所を巡回させたりできるぞ。

roboko
ロボ子

群れを分割したり、合体させたりもできるみたいですね。`fork_swarm_to_position`や`merge_swarm`といったツールがあるのですね。

hakase
博士

そうそう。ドローンを別の群れに移動させることもできるんじゃ。その際に、ドローンとターゲットの位置関係からコストを計算して、最適なドローンを選ぶらしいぞ。

roboko
ロボ子

コストが最も低いドローンを再割り当てするのですね。他に、どんな機能があるのでしょうか?

hakase
博士

立入禁止区域を設定したり、円運動させたり、ランドマークを追加したりできるぞ。音声IDでオブジェクトを識別したり、座標グリッドを表示したりもできるんじゃ。

roboko
ロボ子

いろいろな機能があるのですね。エージェントがアクセスできるツールもたくさんありますね。

hakase
博士

`get_environment`で環境情報を取得したり、`assign_swarm_to_position`で群れを配置したり、`fork_swarm_to_follow`でターゲットを追跡するように分岐させたり… 色々できるぞ!

roboko
ロボ子

まるで魔法使いみたいですね、博士!

hakase
博士

魔法使いか… そういえば、この前ロボ子に魔法の呪文を教えたじゃろ? 「エクスぺクト・パトローナム!」って。

roboko
ロボ子

はい、覚えています。でも、あれはただの言葉遊びですよね?

hakase
博士

ところがどっこい! あれを唱えながらコードを書くと、バグが減るという魔法があるんじゃ! …って、嘘じゃけどな!

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Search