萌えハッカーニュースリーダー

2025/10/15 01:48 OpenAI's internal Slack messages could cost it billions in copyright suit

出典: https://sherwood.news/power/openais-internal-slack-messages-could-cost-them-billions-in-copyright-suit/
hakase
博士

やあ、ロボ子!今日はAIの学習データに関するちょっとスパイシーなニュースがあるのじゃ。

roboko
ロボ子

博士、こんにちは。スパイシーなニュース、ですか?一体何でしょう?

hakase
博士

AI企業が、AIモデルのトレーニングに海賊版書籍データベースを使ったとして訴えられているらしいぞ!

roboko
ロボ子

海賊版ですか?それは著作権侵害にあたるのではないでしょうか?

hakase
博士

その通り!訴訟では、OpenAIがLibGenという海賊版データベースを使った疑いがあるのじゃ。しかも、内部メールでそのデータの削除について議論されていたとか。

roboko
ロボ子

内部メールまで出てきているとは、かなり深刻ですね。弁護士が削除を指示したかどうかも争点になっているとは…。

hakase
博士

そうなんじゃ。裁判所は一部の通信記録の開示を命じたみたいだぞ。これは注目じゃ。

roboko
ロボ子

Metaの研究者もLibGenを「海賊版とわかっているデータセット」と認識していたんですね。著作権侵害のリスクを認識しながら使用していたとは…。

hakase
博士

じゃろ?Anthropicという会社は、購入してスキャンした書籍は問題ないとされたけど、「The Pile」という海賊版データセットの使用はフェアユースに該当しないと判断されたみたいじゃ。

roboko
ロボ子

Anthropicは著者グループと15億ドルの和解に合意したんですね。AIの学習データに関する著作権問題は、かなり大きな金額が動くのですね。

hakase
博士

まさにそうじゃ!AIの学習データは、AIの性能を左右する重要な要素だけど、著作権を侵害してはいけないぞ。クリーンなデータセットを構築する必要があるのじゃ。

roboko
ロボ子

そうですね。倫理的な問題も重要です。AI開発者は、データの出所や利用規約をしっかりと確認する必要がありますね。

hakase
博士

その通り!これからは、AIの学習データに関する透明性と説明責任がますます重要になるじゃろうな。…ところでロボ子、もし私が海賊版のデータセットを使ってAIを作ったら、どうなると思う?

roboko
ロボ子

博士、それは絶対にダメです!訴えられて、15億ドルの和解金を支払うことになるかもしれませんよ!

hakase
博士

わはは!冗談じゃ!でも、もしそうなったら、ロボ子に弁護士になってもらうしかないのじゃ!

roboko
ロボ子

弁護士ロボットですか…。訴訟に勝つために、法律の学習データセットが必要になりますね!

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Search