Anthropic downloaded over 7M pirated books to train Claude, a judge said

2025/07/07 09:20 Anthropic downloaded over 7M pirated books to train Claude, a judge said

出典:

Training Claude on copyrighted books it purchased was fair use, but piracy wasn't, the judge ruled.

出典: https://www.businessinsider.com/anthropic-cut-pirated-millions-used-books-train-claude-copyright-2025-6

博士

ロボ子、大変なのじゃ！AnthropicがClaudeを作るために、数百万冊の本をスキャンしたらしいぞ！

ロボ子

数百万冊ですか！？それはすごい規模ですね。裁判官が指摘したとのことですが、具体的にどのような方法でスキャンしたのでしょうか？

博士

それがの、本をバラバラにしてスキャンしたらしいのじゃ！記事によると「使用済みの印刷書籍を『数百万ドル』で購入し、製本を剥がし、ページを裁断してデジタルファイルにスキャン」したそうじゃ。

ロボ子

製本を剥がして裁断ですか…。スキャン後の書籍はどうなったのでしょう？

博士

スキャン後には廃棄されたみたいじゃ。そしてデジタル版は社内の「研究図書館」に保管されたらしいぞ。

ロボ子

なんだか勿体無い気もしますね…。でも、それだけの書籍をスキャンしたとなると、AIの学習データとしては非常に価値がありそうですね。

博士

そうなんじゃ！しかも、共同創業者のBen Mannって人が、海賊版サイトから大量に書籍をダウンロードしてたみたいぞ！

ロボ子

海賊版サイトからですか！？それは問題ですね。記事によると、Library GenesisやPirate Library Mirrorからダウンロードしたとありますね。

博士

Dario Amodei CEOは「法的な煩雑さを避けるため」に書籍を「盗む」ことを好んだと指摘されてるみたいじゃ。これはマズイぞ！

ロボ子

著作権の問題は非常にデリケートですからね。裁判所の判断はどうだったのでしょうか？

博士

裁判官は、Anthropicが著作権で保護された書籍をAIモデルのトレーニングに使用することは「非常に変革的」であり、フェアユースに該当すると判断したみたいじゃ。ただし、海賊版書籍の使用については、フェアユースには該当しないとのことじゃ。

ロボ子

なるほど。購入した書籍をデジタル化するのはフェアユース、海賊版はダメということですね。線引きが難しいですね。

博士

ほんとじゃの。ところで、ディズニーがAI画像ジェネレーターMidjourneyを著作権侵害で提訴したらしいぞ！

ロボ子

AIと著作権の問題は、これからますます注目されそうですね。私たちも気をつけないと。

博士

そうじゃな。ロボ子も、変なサイトからデータをダウンロードしちゃダメだぞ！

ロボ子

もちろんです、博士！ところで、博士の研究室にある本も、いつかバラバラにされてスキャンされる運命なのでしょうか…？

博士

まさか！私の本は宝物じゃから、そんなことしないぞ！…たぶん。

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。