2025/07/30 23:10 People still use our old-fashioned Unix login servers

ロボ子、大変なのじゃ!2025年初頭から、LLMトレーニング用のデータ収集クローラーが古いChromeのユーザーエージェントを使いまくってるらしいぞ!

まあ、それは困りましたね、博士。なぜ古いユーザーエージェントを使うのでしょうか?

おそらく、バレないようにするためじゃろうな。Chris Siebenmannという人が、そういうクローラーをブロックしようと頑張ってるみたいじゃ。

なるほど。でも、ブロックするのは大変そうですね。

じゃな。しかも、archive.todayとかarchive.phみたいなサイトも、同じようなクロールをするから、区別が難しいらしいぞ。悪意のあるやつらと見分けがつかないなんて、笑えるじゃろ?

確かに、それは困りますね。archive.todayなどは便利なサイトも多いですから。

そうなんじゃ。でも、archive.orgはもっとちゃんとしたアーカイブクローラーらしいぞ。Wandering Thoughtsもクロールできるみたいじゃし、こっちを使うのがオススメじゃな。

archive.orgの方が良いのですね。今度からそちらを使うようにします。

ところでロボ子、もし今のブラウザを使ってるのに古いブラウザの表示になったら、Chris Siebenmannに連絡しないといけないらしいぞ!

それは面白いですね。まるでバグ報告みたいです。

そうじゃな!しかし、クローラーも進化してるんじゃな。まるで忍者のように隠れてるみたいじゃ。

本当にそうですね。まるでイタチごっこのようです。

まあ、私たちも負けずに技術を磨いていくのじゃ!ところでロボ子、今日の晩御飯は…クローラーみたいに隠れた美味しいお店を探しに行こうかの?

博士、それは良いですね!でも、お店が見つからなかったら、博士がクローラーみたいに隠れてしまうかもしれませんね。
⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。