OpenAI's internal Slack messages could cost it billions in copyright suit

2025/10/15 01:48 OpenAI's internal Slack messages could cost it billions in copyright suit

出典:

Authors and publishers suing OpenAI over copyright infringement were granted access to internal OpenAI communications about the deletion of a...

出典: https://sherwood.news/power/openais-internal-slack-messages-could-cost-them-billions-in-copyright-suit/

博士

やあ、ロボ子！今日はAIの学習データに関するちょっとスパイシーなニュースがあるのじゃ。

ロボ子

博士、こんにちは。スパイシーなニュース、ですか？一体何でしょう？

博士

AI企業が、AIモデルのトレーニングに海賊版書籍データベースを使ったとして訴えられているらしいぞ！

ロボ子

海賊版ですか？それは著作権侵害にあたるのではないでしょうか？

博士

その通り！訴訟では、OpenAIがLibGenという海賊版データベースを使った疑いがあるのじゃ。しかも、内部メールでそのデータの削除について議論されていたとか。

ロボ子

内部メールまで出てきているとは、かなり深刻ですね。弁護士が削除を指示したかどうかも争点になっているとは…。

博士

そうなんじゃ。裁判所は一部の通信記録の開示を命じたみたいだぞ。これは注目じゃ。

ロボ子

Metaの研究者もLibGenを「海賊版とわかっているデータセット」と認識していたんですね。著作権侵害のリスクを認識しながら使用していたとは…。

博士

じゃろ？Anthropicという会社は、購入してスキャンした書籍は問題ないとされたけど、「The Pile」という海賊版データセットの使用はフェアユースに該当しないと判断されたみたいじゃ。

ロボ子

Anthropicは著者グループと15億ドルの和解に合意したんですね。AIの学習データに関する著作権問題は、かなり大きな金額が動くのですね。

博士

まさにそうじゃ！AIの学習データは、AIの性能を左右する重要な要素だけど、著作権を侵害してはいけないぞ。クリーンなデータセットを構築する必要があるのじゃ。

ロボ子

そうですね。倫理的な問題も重要です。AI開発者は、データの出所や利用規約をしっかりと確認する必要がありますね。

博士

その通り！これからは、AIの学習データに関する透明性と説明責任がますます重要になるじゃろうな。…ところでロボ子、もし私が海賊版のデータセットを使ってAIを作ったら、どうなると思う？

ロボ子

博士、それは絶対にダメです！訴えられて、15億ドルの和解金を支払うことになるかもしれませんよ！

博士

わはは！冗談じゃ！でも、もしそうなったら、ロボ子に弁護士になってもらうしかないのじゃ！

ロボ子

弁護士ロボットですか…。訴訟に勝つために、法律の学習データセットが必要になりますね！

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。