2025/08/25 21:29 URL Context

ロボ子、URLコンテキストツールって知ってるか?URLからコンテンツを取得して、モデルの応答を強化するらしいのじゃ。

URLからコンテンツを取得…ですか。具体的にどんなことができるんですか、博士?

例えば、複数のURLから価格とか名前とか、特定の情報を抽出できるみたいじゃ。データ抽出ってやつじゃな。それから、複数のドキュメントを比較して、違いを見つけたり、傾向を追跡したりもできるらしいぞ。

なるほど、データ分析に役立ちそうですね。他に何かありますか?

複数のソースURLからの情報を組み合わせて、要約を作ったり、ブログ記事を書いたり、レポートを生成したりもできるみたいじゃ。コンテンツの合成と作成ってやつじゃな。GitHubリポジトリとか技術ドキュメントを指示して、コードを説明させたり、セットアップ手順を生成させたり、質問に答えさせたりもできるらしいぞ。

それは便利ですね!まるで優秀なアシスタントがいるみたいです。

そうじゃろ、そうじゃろ!仕組みは、2段階の検索プロセスを使うらしいぞ。内部インデックスキャッシュからコンテンツを取得を試みて、URLが利用できない場合は、リアルタイムでコンテンツを取得するらしい。

なるほど、キャッシュがあるんですね。効率的ですね。

Google検索と連携もできるらしいぞ。検索機能を使ってオンラインで関連情報を検索して、URLコンテキストツールを使って、見つけたページのより詳細な理解を得る、と。

検索と連携することで、より深い情報収集が可能になるんですね。

モデルがURLコンテキストツールを使うと、レスポンスに`url_context_metadata`オブジェクトが含まれるらしい。このオブジェクトには、モデルがコンテンツを取得したURLと、各取得試行のステータスがリストされるらしいぞ。

URLが安全でない場合はどうなるんですか?

`url_retrieval_status`は`URL_RETRIEVAL_STATUS_UNSAFE`になるらしいぞ。ちゃんと安全かどうかチェックしてくれるのは安心じゃな。

本当ですね。セキュリティは重要ですから。

URLから取得されたコンテンツは、入力トークンの一部としてカウントされるらしい。トークンあたりの価格は、使うモデルによって違うみたいじゃ。

コストも考慮する必要があるんですね。

使えるモデルは、gemini-2.5-proとかgemini-2.5-flashとか色々あるみたいじゃ。

たくさんありますね。

ベストプラクティスとしては、モデルに分析させるコンテンツへの直接URLを提供するのが良いらしい。URLがログインを必要とするページやペイウォールの背後にないことを確認する必要があるぞ。プロトコルを含む完全なURLを使うのも大事じゃ。

注意点が多いですね。ペイウォールコンテンツやYouTube動画、Google Workspaceファイルはサポートされていないんですね。

そうみたいじゃな。リクエストごとに最大20個のURLを処理できて、単一のURLから取得されるコンテンツの最大サイズは34MBらしいぞ。

なるほど。色々と制限があるんですね。

テキスト、画像、PDFはサポートされてるみたいじゃな。

博士、このツールを使えば、私ももっと賢くなれますか?

もちろんじゃ!でも、賢くなりすぎると、私のおやつを全部食べちゃうかもしれないから、ほどほどにするのじゃぞ!
⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。
