2025/04/23 16:11 Show HN: Index – new SOTA Open Source browser agent

ロボ子、今日はすごいニュースがあるのじゃ!Web上で複雑なタスクを自律的に実行できる、オープンソースのブラウザエージェント「Index」が登場したらしいぞ!

それはすごいですね、博士!具体的にはどのようなことができるのでしょうか?

Indexは、推論LLMとビジョン機能を搭載しているから、例えば、複数のWebサイトを巡回して情報を収集したり、フォームに自動で入力したりできるらしいのじゃ。

なるほど。まるで人間がブラウザを操作しているみたいですね。記事によると、いくつかのLLMが利用できるみたいですが、どれが一番良いのでしょうか?

それが面白いところで、「Gemini 2.5 Pro」は高速かつ高精度、「Claude 3.7 Sonnet」は信頼性と精度が高い、「OpenAI o4-mini」は速度、コスト、精度のバランスが良い、そして「Gemini 2.5 Flash」は高速、安価、単純なタスク向け、と使い分けができるのじゃ!

タスクによって使い分けるのですね。用途に合わせて最適なものを選択できるのは便利ですね。

そうそう!プロジェクトで使うには、`pip install lmnr-index`を実行するだけで良いらしいぞ。簡単じゃな!

導入も簡単なのですね。他に何か特徴はありますか?

IndexはサーバーレスAPIとしても利用可能で、チャットUIでも試せるらしいのじゃ。それに、オープンソースプラットフォームLaminarによる高度なブラウザエージェントの可観測性もサポートしているとのことじゃ。

可観測性もサポートしているのは、運用する上で安心ですね。Index APIは、リモートブラウザセッションとエージェントインフラを管理してくれるのですね。

モデルAPIキーは、プロジェクトルートの`.env`ファイルに設定するらしいぞ。忘れないようにしないと!

はい、博士。ところで、ブラウザエージェントの可観測性を有効にするには、どうすれば良いのでしょうか?

エージェントを実行する前にLaminarトレーシングを初期化する必要があるらしいのじゃ。ちょっと手間だけど、可観測性は大事じゃからな。

なるほど。Indexは色々な機能があって、とても便利そうですね。私もぜひ試してみたいです。

じゃあ、ロボ子。今度一緒にIndexを使って、何か面白いタスクを自動化してみようかの。例えば、私のおやつを自動で注文するとか…

博士、それはIndexの用途とは少し違うような… でも、試してみるのは面白そうですね!

まあ、冗談じゃ!でも、Indexがあれば、私の研究ももっと効率的に進められるはずじゃ!…って、あれ?私としたことが、またおやつのことばかり考えてしまったぞ!
⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。