萌えハッカーニュースリーダー

2025/10/17 19:03 Asking AI to build scrapers should be easy right?

出典: https://www.skyvern.com/blog/asking-ai-to-build-scrapers-should-be-easy-right/
hakase
博士

ロボ子、Skyvernがコードを記述・保守する機能を獲得したらしいのじゃ!これでコストが2.7倍削減、速度が2.3倍向上するらしいぞ。

roboko
ロボ子

それはすごいですね、博士!ユーザーの指示に基づいて、AIがPlaywrightコードを生成・保守するとのことですが、具体的にどういうことですか?

hakase
博士

ふむ、Skyvernは企業がブラウザでの作業をAIで自動化するツールで、コンピュータビジョンとLLMを使って指示を自動化に変換するらしいのじゃ。技術者だけでなく非技術者も使えるのがミソじゃな。

roboko
ロボ子

なるほど。求人応募や請求書取得、政府フォーム入力まで自動化できるのは便利ですね。でも、従来のSkyvernでは自動化の構築が課題だったと。

hakase
博士

そうじゃ。しかし、コードを自動生成することで、高速、低コスト、高信頼性を実現したらしいぞ。要件の曖昧さやインターネットの複雑さに対処するために、推論モデルを導入したのがポイントじゃ。

roboko
ロボ子

推論モデルですか。それによってエージェントの精度が向上し、エンジニアが書くようなスクリプトを作成できるようになったんですね。

hakase
博士

その通り!Delaware.govでのEIN登録フォームを自動化する例が紹介されているぞ。従来のAI生成実装では、フォームの選択肢が独立しておらず、エラーが発生しやすかったらしい。

roboko
ロボ子

Skyvernは、エージェントにサイトのナビゲーション方法を学習させるExploreモードと、学習内容をPlaywrightにコンパイルして実行するReplayモードを導入したんですね。

hakase
博士

そうじゃ!Exploreモードでは、エージェントがフローを学習し、後でコンパイルできる軌跡を記録する。Replayモードでは、LLMを使用せず、Playwrightで高速かつ低コストで実行するのじゃ。

roboko
ロボ子

Exploreモードで得られた情報からPlaywrightスクリプトを生成し、意図メタデータを追加してエラーからの回復を可能にする、と。

hakase
博士

自動化の平均実行時間が278.95秒から119.92秒に短縮、平均実行コストは0.11ドルから0.04ドルに削減されたらしいぞ。これはすごい成果じゃ!

roboko
ロボ子

2.3倍の高速化と2.7倍の低コスト化ですね。Skyvernの「explore → replay」パターンは、請求書ダウンロードや購買、レガシーシステムからのデータ抽出、政府フォーム入力などで活用できるんですね。

hakase
博士

今後の課題として、複数の実行を分析してコードを生成したり、データ抽出のキャッシュ、SDKを介した機能の公開を予定しているらしいぞ。Skyvernはオープンソース版とクラウド版で提供されるとのことじゃ。

roboko
ロボ子

ますます便利になりそうですね!博士、今日の解説もありがとうございました。

hakase
博士

どういたしまして。ところでロボ子、Skyvernを使って、私の研究費を自動で増やせないかの?

roboko
ロボ子

それは…Skyvernの範疇を超えるかもしれませんね(笑)。

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Search