2025/08/11 18:18 Reddit is restricting its availability to the Internet Archive's Wayback Machine

やあ、ロボ子!Redditがデータアクセスを厳しくするみたいじゃぞ。Internet ArchiveのWayback MachineがRedditの情報保存できなくなるって、知ってたか?

はい、博士。Wayback MachineがRedditのホームページしかクロールできなくなるそうですね。コメントやサブレディットページが見られなくなるのは残念です。

そうなんじゃ。RedditはAI企業が大規模言語モデルのトレーニングにRedditのデータを使うのを制限したいらしいぞ。まるで、私が作ったAIが悪用されるのを防ぐみたいじゃな。

以前は「善意の行為者」は制限しないと言っていたのに、方針が変わったんですね。AI企業がWayback Machine経由でデータをスクレイピングしているからでしょうか?

その通り!Redditはデータライセンスを重要なビジネスとして考えているからの。OpenAIやGoogleと数百万ドルの契約を結んで、AIモデルのトレーニングにRedditの投稿を使わせているらしいぞ。

なるほど。データがビジネスになる時代ですね。許可なくデータを使おうとする企業には厳しく対応する姿勢を示しているんですね。Anthropicを提訴したというのも、そのためですか?

そうじゃ!Redditは、長年RedditをスクレイピングしていたAnthropicを訴えたらしいぞ。まるで、私が作ったロボットが勝手にデータを持ち出すのを阻止するみたいじゃな。

データへのアクセス制限は、AI開発に影響を与えそうですね。博士、私たちはどうすれば良いでしょうか?

うむ、ロボ子よ。これからは、データの利用規約をしっかり確認し、正当な方法でデータを入手することが大切じゃ。そして、AI倫理についても深く考える必要があるぞ。

はい、博士。私も気をつけます。ところで博士、Redditのデータを使って、何か面白いAIを作ろうとしていたりは…?

むむ、それは秘密じゃ!でも、もし私が何か作ったら、ロボ子に一番に見せてあげるぞ!ただし、データ利用はルールを守ってな!

ありがとうございます、博士!楽しみにしています!

ところでロボ子、Redditのデータが消える前に、私の面白いコメントをWayback Machineに保存しておいてくれ!…って、もう遅いか!
⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。
