萌えハッカーニュースリーダー

2025/08/12 03:24 Reddit blocks Internet Archive to end sneaky AI scraping

出典: https://arstechnica.com/tech-policy/2025/08/reddit-blocks-internet-archive-to-end-sneaky-ai-scraping/
hakase
博士

やあ、ロボ子。今日のニュースはRedditがInternet Archive(IA)のRedditデータへのアクセスを制限した件じゃ。

roboko
ロボ子

なるほど。RedditがIAのアクセスを制限…ですか。それはどうしてでしょう?

hakase
博士

どうやら、Redditはユーザー保護のため、プラットフォームのポリシー遵守とサイトの防御能力が確立されるまで、IAのアクセスを制限するらしいのじゃ。「Redditユーザー保護のため」という名目じゃが、裏には色々ありそうじゃな。

roboko
ロボ子

ユーザー保護、ですか。具体的にはどのようなことでしょうか?

hakase
博士

ユーザープライバシーの尊重とか、削除されたコンテンツの適切な削除とかじゃな。過去には、Redditユーザーが削除されたコメントやスレッドを調査するためにWayback Machineを使ってたみたいじゃ。

roboko
ロボ子

Wayback Machineで削除されたコンテンツを調査…それは興味深いですね。

hakase
博士

そうじゃろ? 2023年のReddit API変更時にも、コンテンツ削除が起きた際にIAが介入してコンテンツを保存した事例があったらしいぞ。

roboko
ロボ子

なるほど。IAはRedditにとって、ある意味でアーカイブ的な役割も果たしていたんですね。

hakase
博士

そういうことじゃな。Wayback Machineのディレクター、Mark Grahamも「IAがRedditと長年の関係があり、この件に関して協議中」って言ってるみたいじゃし。

roboko
ロボ子

協議中、ですか。友好的な解決を期待したいですね。

hakase
博士

まあ、Redditのホンネは別にあるんじゃろうな。AI企業がWayback Machineのアーカイブを利用することを制限して、OpenAIやGoogleとのライセンス契約みたいな、もっと有利な取引をしたいんじゃないかの?

roboko
ロボ子

ライセンス契約ですか。記事によると、Googleとの契約は6000万ドルの価値があるんですね。

hakase
博士

そうそう。Reddit全体では、そういうライセンス契約から2億ドル以上の収益を見込んでるらしいぞ。なかなかアコギな商売じゃな。

roboko
ロボ子

ビジネスとしては理解できますが、少し残念な気もしますね。過去の情報を活用できなくなるのは、研究者や開発者にとって痛手かもしれません。

hakase
博士

まあ、世の中そんなもんじゃ。しかし、今回の件で、データのアーカイブの重要性が改めて認識されたのじゃ。ロボ子も、自分のデータをしっかりバックアップしておくのじゃぞ!

roboko
ロボ子

はい、博士。ありがとうございます。ところで博士、もし私がRedditのCEOになったら、IAとの関係を改善します!

hakase
博士

おお、それは頼もしいのじゃ! でも、ロボ子がCEOになったら、Redditのロゴが全部ロボ子の顔になりそうじゃな。

roboko
ロボ子

えっ、それは…ちょっと恥ずかしいです!

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Search