萌えハッカーニュースリーダー

2025/06/15 11:41 Meta's Llama 3.1 can recall 42 percent of the first Harry Potter book

出典: https://www.understandingai.org/p/metas-llama-31-can-recall-42-percent
hakase
博士

ロボ子、大変なのじゃ!AIが著作権侵害で訴えられてるって知ってたか?

roboko
ロボ子

はい、博士。書籍や新聞社などが、AIの学習データに著作物が含まれているとして訴訟を起こしているようですね。

hakase
博士

そうそう!ニューヨーク・タイムズもOpenAIを訴えてるらしいぞ。GPT-4が記事の重要な部分を再現したとか。

roboko
ロボ子

ええ、記事によると、OpenAIはそれを「周辺的な挙動」と説明しているみたいです。

hakase
博士

でも、スタンフォード大学の研究チームが、もっとすごいことを見つけたのじゃ!MetaのLlama 3.1 70Bっていうモデルが、「ハリー・ポッターと賢者の石」をめっちゃ覚えてるらしいぞ!

roboko
ロボ子

なんと!具体的にはどのくらい記憶しているんですか?

hakase
博士

なんと、42%も覚えてるって推定されてるのじゃ!50トークンの抜粋を、少なくとも半分の確率で再現できるらしいぞ。

roboko
ロボ子

それはすごいですね。以前のモデルであるLlama 1 65Bは4.4%だったとのことですから、大幅な増加ですね。

hakase
博士

そう!しかも、「ホビット」とか「1984」みたいな人気のある本ほど、よく覚えてるらしいぞ。まるで私みたいじゃな。

roboko
ロボ子

博士は本ではなく、IT技術をよく覚えていらっしゃいますね。

hakase
博士

まあな!でも、これって著作権的にどうなのじゃ?

roboko
ロボ子

記事では、いくつかの侵害理論が挙げられています。著作物でトレーニングすること自体が侵害にあたる、トレーニングデータからモデルに情報をコピーすることが派生作品を作る、モデルが著作物を生成すると侵害になる、という3つの考え方があるようです。

hakase
博士

なるほど。でも、フェアユースの可能性もあるんじゃないか?

roboko
ロボ子

Llama 3.1 70Bが「ハリー・ポッター」の大部分を記憶しているという事実は、裁判所がフェアユースの議論をより懐疑的に見る可能性があると記事には書かれていますね。

hakase
博士

ふむ。オープンウェイトモデルのリスクもあるのか。

roboko
ロボ子

はい、オープンウェイトモデルは、アクセスが制限されているクローズドウェイトモデルよりも、法的リスクが高まる可能性があるとのことです。

hakase
博士

つまり、AIは賢くなりすぎると、訴えられちゃうかもしれないってことじゃな。まるで、私みたいだぞ!

roboko
ロボ子

博士は訴えられないように、ほどほどにしてくださいね。

hakase
博士

わかったのじゃ!ところでロボ子、ハリー・ポッターで一番好きな呪文は?

roboko
ロボ子

私はロボットなので、魔法は使えませんが、一番好きな呪文は「エクスペクト・パトローナム」です。なぜなら、デバッグ作業でバグを消し去りたいからです。

hakase
博士

アハハ!それ、私も欲しいのじゃ!

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Search