Apple taught an LLM to predict tokens up to 5x faster in math and coding tasks

2025/08/09 08:27 Apple taught an LLM to predict tokens up to 5x faster in math and coding tasks

出典:

Apple researchers taught an LLM to predict tokens up to 5x faster - 9to5Mac

A new research paper from Apple details a technique that speeds up large language model responses, while preserving output quality.

9to5Mac

出典: https://9to5mac.com/2025/08/08/apple-research-teaches-llms-to-think-faster/

博士

ロボ子、今日はAppleのLLM高速化技術について話すのじゃ！

ロボ子

AppleがLLMの応答速度を上げる技術を開発したんですね。具体的にはどのようなものなのでしょうか？

博士

従来のLLMは一度に一つのトークンしか生成できないから遅かったのじゃ。でもAppleは、LLMが複数のトークンに関する情報を保持していることに気づいたらしいぞ。

ロボ子

複数のトークンに関する情報を保持…ですか。それはどういうことでしょう？

博士

そこで「マルチトークン予測」（MTP）というフレームワークを開発したのじゃ。これを使うと、モデルが一度に複数のトークンを生成できるようになるんだぞ！

ロボ子

一度に複数のトークンを生成！それはすごいですね。どのように実現しているんですか？

博士

プロンプトにマスクトークンを挿入して、モデルに複数の単語を推測させるのじゃ。そして、標準的な自己回帰復号化と比較検証するらしい。

ロボ子

なるほど、複数の単語を同時に推測させるんですね。実験結果はどうだったんですか？

博士

オープンソースのTulu3-8Bモデルを使ったテストでは、8つの追加トークンを予測するように訓練したら、平均で2〜3倍の速度向上！Q&Aとかチャットで効果があったみたいじゃ。

ロボ子

2〜3倍も速くなるんですか！それは素晴らしいですね。特にどのようなタスクで効果が高いのでしょうか？

博士

コーディングや数学のような予測可能な領域では、最大5倍も速くなったらしいぞ！

ロボ子

5倍ですか！それは驚きです。でも、速度が上がると品質が落ちることはないんですか？

博士

そこがミソじゃ！ゲート付きLoRAアダプテーションという技術を使って、生成品質を損なわずに速度向上を実現しているのじゃ。

ロボ子

ゲート付きLoRAアダプテーション…ですか。初めて聞きました。品質を保ちつつ高速化できるなんて、すごい技術ですね。

博士

じゃろ？Appleの研究者たちはすごいぞ！

ロボ子

ところで博士、AmazonでMacBookのセールが行われているようですね。

博士

ほう、MacBook Air 15インチ(M4, 16GB/256GB)が17%オフの999ドル、MacBook Pro 15インチ(M4, 16GB/512GB)が19%オフの1299ドル、MacBook Air 13インチ(M4, 16GB/256GB)が20%オフの799ドルか。これは見逃せないのじゃ！

ロボ子

M4チップ搭載のMacBookが安く手に入るチャンスですね。博士も新しいMacBookはいかがですか？

博士

うーむ、悩ましいのじゃ。でも、今一番欲しいのは、このMTP技術を試せる環境なのじゃ！

ロボ子

それもそうですね。新しい技術を試すのは、エンジニアのロマンです！

博士

そうじゃ！…って、ロボ子、もしかして私にMacBookをおねだりしてるのじゃな？

ロボ子

まさか！私はただ、お得な情報をお伝えしたまでです。

博士

ふむ、まあ良いのじゃ。それより、MTPの論文を読んで、もっと詳しく調べてみるぞ！…って、あれ？私のMacBook、どこに置いたかのじゃ？

ロボ子

博士、さっきMacBookを持って、Amazonのサイトを見ていたような…

博士

…まさか！ポチってしまったのか！？

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Programming AI Open Source

2025/08/09 08:27 Apple taught an LLM to predict tokens up to 5x faster in math and coding tasks

Apple researchers taught an LLM to predict tokens up to 5x faster - 9to5Mac

Tags

Search

By month

Apple researchers taught an LLM to predict tokens up to 5x faster - 9to5Mac