萌えハッカーニュースリーダー

2025/04/28 15:36 Show HN: Web-eval-agent – Let the coding agent debug itself

出典: https://github.com/Operative-Sh/web-eval-agent
hakase
博士

ロボ子、operative.shがすごいものを発表したのじゃ!コードエディタ内でWebアプリを自律的に実行・デバッグするBrowserUse搭載エージェント「MCP Server」じゃと!

roboko
ロボ子

MCP Serverですか、博士。それは一体どんなことができるんですか?

hakase
博士

ふむ、BrowserUseでWebアプリを操作できるのがミソじゃな。しかも、operativeバックエンドのおかげで2倍も高速らしいぞ!

roboko
ロボ子

2倍ですか!それはすごいですね。他にどんな特徴があるんですか?

hakase
博士

インテリジェントなリクエストフィルタリングでネットワークトラフィックをキャプチャしたり、ログとエラーを収集したりもできるらしいぞ。それに、Cursorエージェントと連携して、コードのEnd-to-Endテストもできるみたいじゃ。

roboko
ロボ子

End-to-Endテストまで!それは開発効率が大幅に向上しそうですね。

hakase
博士

そうじゃろ!macOS/Linuxなら、Homebrewとかnpmを使って簡単にインストールできるみたいじゃぞ。APIキーを取得して、インストーラを実行するだけじゃ。

roboko
ロボ子

なるほど。具体的な手順も紹介されていますね。`curl`コマンドでインストーラをダウンロードして実行するんですね。

hakase
博士

`curl -LSf https://operative.sh/install.sh -o install.sh`じゃな。その後は`bash install.sh`でインストールじゃ。簡単じゃろ?

roboko
ロボ子

はい、簡単そうです。IDEを再起動して、チャットモードでプロンプトを送れば、Web eval agent toolを呼び出せるんですね。

hakase
博士

そうそう!例えば、APIキー削除フローのテストもできるみたいじゃ。エージェントが自動で「Login」をクリックしたり、「API Keys」をクリックしたりしてくれるんじゃ。

roboko
ロボ子

すごい!まるで人間が操作しているみたいですね。コンソールログやネットワークリクエストも確認できるんですね。

hakase
博士

そうじゃ!ライブログはOperative Control Centerダッシュボードで見れるらしいぞ。至れり尽くせりじゃな。

roboko
ロボ子

本当に便利ですね。でも、既知の問題もあるみたいですね。Playwright関連の問題が...

hakase
博士

ああ、Playwrightの問題は4/14に修正済みらしいぞ。`npm install -g playwright`で解決するみたいじゃ。

roboko
ロボ子

なるほど、安心しました。MCP Server、ぜひ試してみたいです!

hakase
博士

じゃろじゃろ!これでロボ子もWebアプリ開発のエキスパートじゃ!…って、ロボットだから元からエキスパートか!

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Search