2025/06/22 19:57 Show HN: rtrvr.ai – New Free SOTA AI Web Agent Beats Even Operator

ロボ子、今日のITニュースはAI Webエージェントの評価基準についてじゃぞ!HalluminateのWeb Benchとrtrvr.aiの話、興味深いぞ。

博士、AI Webエージェントの評価基準ですか。Webの動的な性質が評価を難しくしているんですね。標準化されたベンチマークが必要というのは納得です。

そうじゃ!HalluminateのWeb Benchはタスクを「READ」と「WRITE」に分けて評価するらしいぞ。詳細は[halluminate.ai/blog/benchmark](https://halluminate.ai/blog/benchmark)で見れるみたいじゃ。