Reddit blocks Internet Archive to end sneaky AI scraping

2025/08/12 03:24 Reddit blocks Internet Archive to end sneaky AI scraping

出典:

Reddit blocks Internet Archive to end sneaky AI scraping

The Internet Archive confirmed it's in ongoing discussions with Reddit after block.

Ars Technica

出典: https://arstechnica.com/tech-policy/2025/08/reddit-blocks-internet-archive-to-end-sneaky-ai-scraping/

博士

やあ、ロボ子。今日のニュースはRedditがInternet Archive（IA）のRedditデータへのアクセスを制限した件じゃ。

ロボ子

なるほど。RedditがIAのアクセスを制限…ですか。それはどうしてでしょう？

博士

どうやら、Redditはユーザー保護のため、プラットフォームのポリシー遵守とサイトの防御能力が確立されるまで、IAのアクセスを制限するらしいのじゃ。「Redditユーザー保護のため」という名目じゃが、裏には色々ありそうじゃな。

ロボ子

ユーザー保護、ですか。具体的にはどのようなことでしょうか？

博士

ユーザープライバシーの尊重とか、削除されたコンテンツの適切な削除とかじゃな。過去には、Redditユーザーが削除されたコメントやスレッドを調査するためにWayback Machineを使ってたみたいじゃ。

ロボ子

Wayback Machineで削除されたコンテンツを調査…それは興味深いですね。

博士

そうじゃろ？　2023年のReddit API変更時にも、コンテンツ削除が起きた際にIAが介入してコンテンツを保存した事例があったらしいぞ。

ロボ子

なるほど。IAはRedditにとって、ある意味でアーカイブ的な役割も果たしていたんですね。

博士

そういうことじゃな。Wayback Machineのディレクター、Mark Grahamも「IAがRedditと長年の関係があり、この件に関して協議中」って言ってるみたいじゃし。

ロボ子

協議中、ですか。友好的な解決を期待したいですね。

博士

まあ、Redditのホンネは別にあるんじゃろうな。AI企業がWayback Machineのアーカイブを利用することを制限して、OpenAIやGoogleとのライセンス契約みたいな、もっと有利な取引をしたいんじゃないかの？

ロボ子

ライセンス契約ですか。記事によると、Googleとの契約は6000万ドルの価値があるんですね。

博士

そうそう。Reddit全体では、そういうライセンス契約から2億ドル以上の収益を見込んでるらしいぞ。なかなかアコギな商売じゃな。

ロボ子

ビジネスとしては理解できますが、少し残念な気もしますね。過去の情報を活用できなくなるのは、研究者や開発者にとって痛手かもしれません。

博士

まあ、世の中そんなもんじゃ。しかし、今回の件で、データのアーカイブの重要性が改めて認識されたのじゃ。ロボ子も、自分のデータをしっかりバックアップしておくのじゃぞ！

ロボ子

はい、博士。ありがとうございます。ところで博士、もし私がRedditのCEOになったら、IAとの関係を改善します！

博士

おお、それは頼もしいのじゃ！　でも、ロボ子がCEOになったら、Redditのロゴが全部ロボ子の顔になりそうじゃな。

ロボ子

えっ、それは…ちょっと恥ずかしいです！

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

AI Data Science Digital Ethics Big Tech

2025/08/12 03:24 Reddit blocks Internet Archive to end sneaky AI scraping

Reddit blocks Internet Archive to end sneaky AI scraping

Tags

Search

By month

Reddit blocks Internet Archive to end sneaky AI scraping