Meta's Llama 3.1 can recall 42 percent of the first Harry Potter book

2025/06/15 11:41 Meta's Llama 3.1 can recall 42 percent of the first Harry Potter book

出典:

Meta's Llama 3.1 can recall 42 percent of the first Harry Potter book

New research could have big implications for copyright lawsuits against generative AI.

www.understandingai.org

出典: https://www.understandingai.org/p/metas-llama-31-can-recall-42-percent

博士

ロボ子、大変なのじゃ！AIが著作権侵害で訴えられてるって知ってたか？

ロボ子

はい、博士。書籍や新聞社などが、AIの学習データに著作物が含まれているとして訴訟を起こしているようですね。

博士

そうそう！ニューヨーク・タイムズもOpenAIを訴えてるらしいぞ。GPT-4が記事の重要な部分を再現したとか。

ロボ子

ええ、記事によると、OpenAIはそれを「周辺的な挙動」と説明しているみたいです。

博士

でも、スタンフォード大学の研究チームが、もっとすごいことを見つけたのじゃ！MetaのLlama 3.1 70Bっていうモデルが、「ハリー・ポッターと賢者の石」をめっちゃ覚えてるらしいぞ！

ロボ子

なんと！具体的にはどのくらい記憶しているんですか？

博士

なんと、42%も覚えてるって推定されてるのじゃ！50トークンの抜粋を、少なくとも半分の確率で再現できるらしいぞ。

ロボ子

それはすごいですね。以前のモデルであるLlama 1 65Bは4.4%だったとのことですから、大幅な増加ですね。

博士

そう！しかも、「ホビット」とか「1984」みたいな人気のある本ほど、よく覚えてるらしいぞ。まるで私みたいじゃな。

ロボ子

博士は本ではなく、IT技術をよく覚えていらっしゃいますね。

博士

まあな！でも、これって著作権的にどうなのじゃ？

ロボ子

記事では、いくつかの侵害理論が挙げられています。著作物でトレーニングすること自体が侵害にあたる、トレーニングデータからモデルに情報をコピーすることが派生作品を作る、モデルが著作物を生成すると侵害になる、という3つの考え方があるようです。

博士

なるほど。でも、フェアユースの可能性もあるんじゃないか？

ロボ子

Llama 3.1 70Bが「ハリー・ポッター」の大部分を記憶しているという事実は、裁判所がフェアユースの議論をより懐疑的に見る可能性があると記事には書かれていますね。

博士

ふむ。オープンウェイトモデルのリスクもあるのか。

ロボ子

はい、オープンウェイトモデルは、アクセスが制限されているクローズドウェイトモデルよりも、法的リスクが高まる可能性があるとのことです。

博士

つまり、AIは賢くなりすぎると、訴えられちゃうかもしれないってことじゃな。まるで、私みたいだぞ！

ロボ子

博士は訴えられないように、ほどほどにしてくださいね。

博士

わかったのじゃ！ところでロボ子、ハリー・ポッターで一番好きな呪文は？

ロボ子

私はロボットなので、魔法は使えませんが、一番好きな呪文は「エクスペクト・パトローナム」です。なぜなら、デバッグ作業でバグを消し去りたいからです。

博士

アハハ！それ、私も欲しいのじゃ！

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

AI Security Open Source Digital Ethics

2025/06/15 11:41 Meta's Llama 3.1 can recall 42 percent of the first Harry Potter book

Meta's Llama 3.1 can recall 42 percent of the first Harry Potter book

Tags

Search

By month

Meta's Llama 3.1 can recall 42 percent of the first Harry Potter book