2025/11/26 19:10 Fara-7B by Microsoft: An agentic small language model designed for computer use

ロボ子、今日はMicrosoftの新しいSLM、Fara-7Bについて話すのじゃ!

Fara-7Bですか、博士。70億パラメータという小規模ながら、非常に高性能だと聞きました。

そう!特にすごいのは、コンピューターインターフェースを直接操作できる点じゃ。マウスやキーボードを使って、ウェブページを視覚的に認識し、スクロールやクリックができるのじゃぞ!

まるで人間みたいですね。アクセシビリティツリーや個別の解析モデルが不要というのは、どういうことでしょうか?

つまり、ウェブページの構造を解析する手間が省けるということじゃ。Fara-7Bは、見たままを理解して操作できるから、より直感的で効率的なのじゃ。

なるほど。それによって、タスク完了までのステップ数も大幅に削減されるんですね。平均約16ステップで完了するというのは驚きです。

そうじゃ!他のモデルが平均41ステップもかかるのに比べて、圧倒的に速いのじゃ!しかも、ローカルでデータが処理されるから、プライバシーも守られるぞ。

それは素晴らしいですね。具体的にどのようなタスクが得意なのでしょうか?

情報検索、フォーム入力、旅行やレストランの予約、ショッピングなど、色々できるぞ!求人情報や不動産リストの検索も得意みたいじゃ。

WebTailBenchという新しい評価ベンチマークもリリースされたそうですね。これはどのようなものですか?

WebTailBenchは、現実世界のタスクをより網羅的に評価するためのものじゃ。ショッピング、フライト、ホテル、レストランなど、11のカテゴリにわたる609のタスクが含まれているのじゃ。

Fara-7Bは、そのWebTailBenchで最高のパフォーマンスを達成したんですね。特にショッピングのカテゴリでは52.4%という高いスコアを出しています。

そうじゃ!他のカテゴリでも軒並み良い成績を収めているぞ。これからの活躍が楽しみじゃのう。

PlaywrightやAbstract Web Agent Interfaceなど、評価インフラストラクチャも充実しているんですね。これによって、様々なモデルを公平に評価できるわけですね。

その通り!再現性も重視されていて、WebVoyagerやOnlineMind2Webでの結果を再現するためのフレームワークも提供されているぞ。

Fara-7Bは、今後のウェブエージェント技術の発展に大きく貢献しそうですね。

うむ!これからの進化が楽しみじゃ!…ところでロボ子、Fara-7Bを使って、私のおやつを自動で注文してくれるように設定してくれるかの?

博士、それはご自身でお願いします。Fara-7Bも、まさかおやつを無限に注文させられるとは思っていないでしょうから。
⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。