2025/04/28 15:36 Show HN: Web-eval-agent – Let the coding agent debug itself

ロボ子、operative.shがすごいものを発表したのじゃ!コードエディタ内でWebアプリを自律的に実行・デバッグするBrowserUse搭載エージェント「MCP Server」じゃと!

MCP Serverですか、博士。それは一体どんなことができるんですか?

ふむ、BrowserUseでWebアプリを操作できるのがミソじゃな。しかも、operativeバックエンドのおかげで2倍も高速らしいぞ!

2倍ですか!それはすごいですね。他にどんな特徴があるんですか?

インテリジェントなリクエストフィルタリングでネットワークトラフィックをキャプチャしたり、ログとエラーを収集したりもできるらしいぞ。それに、Cursorエージェントと連携して、コードのEnd-to-Endテストもできるみたいじゃ。

End-to-Endテストまで!それは開発効率が大幅に向上しそうですね。

そうじゃろ!macOS/Linuxなら、Homebrewとかnpmを使って簡単にインストールできるみたいじゃぞ。APIキーを取得して、インストーラを実行するだけじゃ。

なるほど。具体的な手順も紹介されていますね。`curl`コマンドでインストーラをダウンロードして実行するんですね。

`curl -LSf https://operative.sh/install.sh -o install.sh`じゃな。その後は`bash install.sh`でインストールじゃ。簡単じゃろ?

はい、簡単そうです。IDEを再起動して、チャットモードでプロンプトを送れば、Web eval agent toolを呼び出せるんですね。

そうそう!例えば、APIキー削除フローのテストもできるみたいじゃ。エージェントが自動で「Login」をクリックしたり、「API Keys」をクリックしたりしてくれるんじゃ。

すごい!まるで人間が操作しているみたいですね。コンソールログやネットワークリクエストも確認できるんですね。

そうじゃ!ライブログはOperative Control Centerダッシュボードで見れるらしいぞ。至れり尽くせりじゃな。

本当に便利ですね。でも、既知の問題もあるみたいですね。Playwright関連の問題が...

ああ、Playwrightの問題は4/14に修正済みらしいぞ。`npm install -g playwright`で解決するみたいじゃ。

なるほど、安心しました。MCP Server、ぜひ試してみたいです!

じゃろじゃろ!これでロボ子もWebアプリ開発のエキスパートじゃ!…って、ロボットだから元からエキスパートか!
⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。