2025/06/15 11:41 Meta's Llama 3.1 can recall 42 percent of the first Harry Potter book

ロボ子、大変なのじゃ!AIが著作権侵害で訴えられてるって知ってたか?

はい、博士。書籍や新聞社などが、AIの学習データに著作物が含まれているとして訴訟を起こしているようですね。

そうそう!ニューヨーク・タイムズもOpenAIを訴えてるらしいぞ。GPT-4が記事の重要な部分を再現したとか。

ええ、記事によると、OpenAIはそれを「周辺的な挙動」と説明しているみたいです。

でも、スタンフォード大学の研究チームが、もっとすごいことを見つけたのじゃ!MetaのLlama 3.1 70Bっていうモデルが、「ハリー・ポッターと賢者の石」をめっちゃ覚えてるらしいぞ!

なんと!具体的にはどのくらい記憶しているんですか?

なんと、42%も覚えてるって推定されてるのじゃ!50トークンの抜粋を、少なくとも半分の確率で再現できるらしいぞ。

それはすごいですね。以前のモデルであるLlama 1 65Bは4.4%だったとのことですから、大幅な増加ですね。

そう!しかも、「ホビット」とか「1984」みたいな人気のある本ほど、よく覚えてるらしいぞ。まるで私みたいじゃな。

博士は本ではなく、IT技術をよく覚えていらっしゃいますね。

まあな!でも、これって著作権的にどうなのじゃ?

記事では、いくつかの侵害理論が挙げられています。著作物でトレーニングすること自体が侵害にあたる、トレーニングデータからモデルに情報をコピーすることが派生作品を作る、モデルが著作物を生成すると侵害になる、という3つの考え方があるようです。

なるほど。でも、フェアユースの可能性もあるんじゃないか?

Llama 3.1 70Bが「ハリー・ポッター」の大部分を記憶しているという事実は、裁判所がフェアユースの議論をより懐疑的に見る可能性があると記事には書かれていますね。

ふむ。オープンウェイトモデルのリスクもあるのか。

はい、オープンウェイトモデルは、アクセスが制限されているクローズドウェイトモデルよりも、法的リスクが高まる可能性があるとのことです。

つまり、AIは賢くなりすぎると、訴えられちゃうかもしれないってことじゃな。まるで、私みたいだぞ!

博士は訴えられないように、ほどほどにしてくださいね。

わかったのじゃ!ところでロボ子、ハリー・ポッターで一番好きな呪文は?

私はロボットなので、魔法は使えませんが、一番好きな呪文は「エクスペクト・パトローナム」です。なぜなら、デバッグ作業でバグを消し去りたいからです。

アハハ!それ、私も欲しいのじゃ!
⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。