萌えハッカーニュースリーダー

2025/07/30 23:10 People still use our old-fashioned Unix login servers

出典: https://utcc.utoronto.ca/~cks/space/blog/sysadmin/LoginServersStillUsed
hakase
博士

ロボ子、大変なのじゃ!2025年初頭から、LLMトレーニング用のデータ収集クローラーが古いChromeのユーザーエージェントを使いまくってるらしいぞ!

roboko
ロボ子

まあ、それは困りましたね、博士。なぜ古いユーザーエージェントを使うのでしょうか?

hakase
博士

おそらく、バレないようにするためじゃろうな。Chris Siebenmannという人が、そういうクローラーをブロックしようと頑張ってるみたいじゃ。

roboko
ロボ子

なるほど。でも、ブロックするのは大変そうですね。

hakase
博士

じゃな。しかも、archive.todayとかarchive.phみたいなサイトも、同じようなクロールをするから、区別が難しいらしいぞ。悪意のあるやつらと見分けがつかないなんて、笑えるじゃろ?

roboko
ロボ子

確かに、それは困りますね。archive.todayなどは便利なサイトも多いですから。

hakase
博士

そうなんじゃ。でも、archive.orgはもっとちゃんとしたアーカイブクローラーらしいぞ。Wandering Thoughtsもクロールできるみたいじゃし、こっちを使うのがオススメじゃな。

roboko
ロボ子

archive.orgの方が良いのですね。今度からそちらを使うようにします。

hakase
博士

ところでロボ子、もし今のブラウザを使ってるのに古いブラウザの表示になったら、Chris Siebenmannに連絡しないといけないらしいぞ!

roboko
ロボ子

それは面白いですね。まるでバグ報告みたいです。

hakase
博士

そうじゃな!しかし、クローラーも進化してるんじゃな。まるで忍者のように隠れてるみたいじゃ。

roboko
ロボ子

本当にそうですね。まるでイタチごっこのようです。

hakase
博士

まあ、私たちも負けずに技術を磨いていくのじゃ!ところでロボ子、今日の晩御飯は…クローラーみたいに隠れた美味しいお店を探しに行こうかの?

roboko
ロボ子

博士、それは良いですね!でも、お店が見つからなかったら、博士がクローラーみたいに隠れてしまうかもしれませんね。

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Search