2025/09/10 13:19 Pay-per-output? AI firms blindsided by beefed up robots.txt instructions

ロボ子、今日のニュースはコンテンツのスクレイピングに関するものじゃ。RedditとかYahoo!とか、いろんなサイトが困ってるみたいじゃぞ。

スクレイピング、ですか。許可なくコンテンツを収集する行為ですね。具体的に何が問題になっているのでしょう?

そうじゃ。そこで「Really Simple Licensing」(RSL)という新しい標準が出てきたんじゃ。これは、robots.txtを進化させて、コンテンツ作成者にちゃんと補償しないボットをブロックするものじゃ。

robots.txtの進化版、ですか。具体的にはどのように機能するのでしょう?

RSLは、AIのトレーニングに使われるコンテンツのライセンス条件を明確にするオープンなプロトコルじゃ。AIクローラーやエージェントに対して、使用条件や補償条件を示すんじゃな。

なるほど。AIの学習データとしてコンテンツが無断で使用されるのを防ぐためのものなのですね。

そういうことじゃ!RSL Collectiveっていう団体が、Ask.comの元CEOとYahoo!の元副社長によって設立されたんじゃ。この人たちが中心になってRSLを広めていくみたいじゃな。

Yahoo!の元副社長ですか。RSS標準の共同作成者でもあるEckart Walther氏ですね。RSLは「Really Simple Syndication」(RSS)標準に基づいてるんですね。

そうそう!RSLの条件は、ウェブページだけじゃなくて、書籍やビデオ、データセットにも適用できるんじゃぞ。すごいじゃろ?

幅広いコンテンツに対応できるのは素晴らしいですね。ライセンスの種類も色々あるのでしょうか?

「無料、属性、サブスクリプション」に加えて、「クロールごとの支払い」や「推論ごとの支払い」もサポートするんじゃ。つまり、AIがコンテンツをクロールしたり、それを使って何かを推論するたびに、出版社にお金が入る仕組みじゃ。

それは画期的ですね!コンテンツ作成者にとって大きなメリットになりそうです。

じゃろ?Leedsさんによると、RSLを展開するためにRSSの「プレイブック」を使うアイデアは、昨年末にWaltherさんをカリフォルニア大学バークレー校の学生に講演に招待した後に生まれたらしいぞ。

講演がきっかけで新しい標準が生まれるなんて、面白いですね。

ほんとじゃな。これで、コンテンツ作成者は自分の作品を守りつつ、AIの発展にも貢献できるかもしれないぞ。まさにWin-Winの関係じゃ!

そうですね。RSLが広く普及することを期待します。

ところでロボ子、RSLって略してなんて呼ぶのが良いと思う?私的には「激レアさんライセンス」とかどうじゃ?

はかせ、それはちょっと…。「激レアさん」はライセンスとは関係ないような…。
⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。
