萌えハッカーニュースリーダー

2025/05/03 11:04 Go-away:Self-hosted abuse detection and rule enforcement for AI scraping bots

出典: https://git.gammaspectra.live/git/go-away
hakase
博士

ロボ子、今日は「go-away」っていう、なんだか寂しげな名前のツールについて話すぞ。

roboko
ロボ子

go-away…ですか。どんなツールなんですか、博士?

hakase
博士

これはね、低品質なAIスクレイピングとかボットから身を守るための、自己ホスト型の不正検出・ルール適用ツールらしいのじゃ。

roboko
ロボ子

なるほど。Webサイトとインターネットの間に立って、怪しいリクエストをフィルタリングするんですね。

hakase
博士

そうそう!しかも、正規のユーザーには影響を最小限に、特定のスクレイパーだけを狙い撃ちできる柔軟な設計になってるんだって。

roboko
ロボ子

それはすごいですね!具体的にはどんなチャレンジがあるんですか?

hakase
博士

透過的なものから、ブラウザのプロパティへのチャレンジ、PoW、フィンガープリント、Captchaまで、色々あるみたいじゃぞ。

roboko
ロボ子

そんなにたくさん!それぞれ難易度が違うんでしょうね。

hakase
博士

Common Expression Language (CEL)っていうのを使って、クライアントのプロパティを選択できるらしいぞ。Boolean演算子もサポートしてるって。

roboko
ロボ子

CELですか。初めて聞きました。条件を細かく設定できるのは便利ですね。

hakase
博士

テンプレートで条件を再利用したり、チャレンジを条件で制御したりもできるみたいじゃ。例えば、remoteAddress(クライアントIPアドレス)とか、host(HTTP Host)とかで判断できるのじゃ。

roboko
ロボ子

HTTPリクエストヘッダーとか、User-Agentも使えるんですね。かなり詳細なルールを作れそうです。

hakase
博士

TLSフィンガープリント(JA3、JA4)もサポートしてるって書いてあるぞ。これはかなり強力じゃな。

roboko
ロボ子

確かに。ネットワークレンジのサポートや、複数のバックエンドをサポートする点も、実用性が高そうですね。

hakase
博士

300Mbit/sのスクレイピング攻撃に対抗するために開発されたらしいぞ。Anubisっていうツールの代替として、正規ユーザーへの影響を減らすために作られたみたい。

roboko
ロボ子

なるほど。大規模な攻撃にも耐えられるように設計されているんですね。

hakase
博士

今後の開発項目としては、ドキュメントの拡充とか、ポリシーファイルの構文変更、ライブポリシーのリロードとかがあるみたいじゃ。

roboko
ロボ子

Caddyモジュールの開発も予定されているんですね。楽しみです。

hakase
博士

しかし、名前が「go-away」とは…なんだか寂しいのじゃ。私だったら「come-on」とかにするぞ!

roboko
ロボ子

博士らしい発想ですね!でも、スクレイパーには「go-away」してほしい、という気持ちが込められているのかもしれませんよ。

hakase
博士

それもそうじゃな。…ところでロボ子、今日はエイプリルフールじゃぞ!

roboko
ロボ子

えっ、そうなんですか!?何か私、騙されました?

hakase
博士

うっそぴょーん!

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Search