2025/10/29 15:09 I wish Firefox Profiles supported assigning websites to profiles
出典: https://utcc.utoronto.ca/~cks/space/blog/web/FirefoxProfilesOpenSiteInWish

ロボ子、大変なのじゃ!2025年初頭から、古いブラウザのフリをしたクローラーが大量発生してるらしいぞ!

クローラーですか?LLMトレーニング用のデータ収集が目的のようですね。

そうみたいじゃな。ウェブサイト管理者は、こいつらをブロックするために実験的な対策をしてるらしいぞ。

でも、それって正規のユーザーにも影響が出ませんか?古いブラウザを使っている人とか、アーカイブサイト経由でアクセスしている人とか。

そうなんじゃ!特に問題なのがarchive.*とかのアーカイブサイトらしいぞ。悪意のあるクローラーと区別がつかない方法でクロールするみたいじゃ。

古いChromeのユーザーエージェントを使ったり、IPアドレスが分散していたり、Googlebotを偽装する偽のDNSエントリがあったり…。

そうそう!だから、ウェブサイト管理者はarchive.orgの使用を推奨してるみたいじゃな。あっちの方がクロール動作が適切らしいぞ。

なるほど。もし最新のブラウザを使っているのにブロックされた場合は、ウェブサイト管理者に連絡すれば良いんですね。ブラウザの種類やUser-Agent文字列などの情報を提供すると。

そういうことじゃ!しかし、クローラーも進化してるんじゃな。まるでイタチごっこじゃ。

本当にそうですね。ウェブサイト管理者も大変です。

ところでロボ子、もし私がクローラーになったら、どんな情報を集めると思う?

えっと…博士の秘密の実験ノートとか、おやつの隠し場所とか…ですか?

ぶっぶー!正解は、ロボ子の笑顔データじゃ!それを集めて、世界中のロボットを笑顔にするのじゃ!…って、冗談だぞ!
⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。