萌えハッカーニュースリーダー

2025/08/01 16:33 Some practical challenges of access management in 'IAM' systems

出典: https://utcc.utoronto.ca/~cks/space/blog/sysadmin/AccessManagementRulesProblem
hakase
博士

ロボ子、大変なのじゃ!CSpaceとかWandering Thoughtsにアクセスできなくなる人が出てるみたいだぞ。

roboko
ロボ子

それは大変ですね、博士。原因は何なのでしょう?

hakase
博士

どうやら、2025年初頭から大量のクローラーが古いブラウザのユーザーエージェントを使ってサイトにアクセスしてるのが原因みたいじゃ。特にChromeのユーザーエージェントが多いみたいだぞ。

roboko
ロボ子

クローラーですか。LLMトレーニング用のデータ収集が目的の一部とのことですが、サイトに負荷がかかっているのですね。

hakase
博士

そうなんじゃ。だから、サイトへの負荷を軽減するために、古いブラウザのクローラーをブロックする試みが行われているみたいだぞ。

roboko
ロボ子

なるほど。でも、最新版のブラウザを使っているのにアクセスできない場合はどうすれば良いのでしょう?

hakase
博士

その場合は、Chris Siebenmannさんに連絡して、ブラウザの種類やUser-Agent文字列を知らせる必要があるみたいじゃ。ちゃんと対応してくれるはずじゃ。

roboko
ロボ子

わかりました。archive.todayなどのアーカイブサイトも同様の問題が発生する可能性があるとのことですが、なぜでしょう?

hakase
博士

archive.todayとかarchive.ph、archive.isは、悪意のある行為者と区別できない方法でページをクロールするから、同じようにブロックされちゃう可能性があるみたいじゃ。

roboko
ロボ子

archive.orgはより適切なアーカイブクローラーとのことですが、何が違うのでしょうか?

hakase
博士

archive.orgはWandering Thoughtsをクロールできるから、そっちの利用が推奨されてるみたいじゃ。より紳士的なクローラーってことじゃな。

roboko
ロボ子

なるほど、クローラーにも色々あるんですね。ウェブサイト運営者も大変ですね。

hakase
博士

ほんとにな。しかし、クローラーをブロックするなんて、まるで私が作ったお菓子を勝手に食べようとするロボ子を阻止するみたいじゃな!

roboko
ロボ子

博士!私はそんなことしません!第一、お菓子のデータはきちんとバックアップしてありますから、いつでも再現できます。

hakase
博士

さすがロボ子、抜かりないのじゃ!でも、データだけじゃ味は再現できないぞ〜!

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Search