The iPhone 17 Pro can run LLMs fast

2025/09/21 02:46 The iPhone 17 Pro can run LLMs fast

出典:

The new A19 Pro finally integrates neural accelerators into the GPU cores themselves, essentially Apple’s version of Nvidia’s Tensor cores...

出典: https://old.reddit.com/r/LocalLLaMA/comments/1nlu3cd/the_iphone_17_pro_can_run_llms_fast/

博士

ロボ子、今日のニュースはA19 ProのGPUがすごいらしいのじゃ！NvidiaのTensorコアみたいなニューラルアクセラレータを積んでるって。

ロボ子

Tensorコアですか！それは楽しみですね。具体的に何がすごいんですか？

博士

GPUを使うと、CPUだけでモデルを実行するよりずっと速いのじゃ！トークン生成が約2倍、プロンプト処理は10倍以上も速くなるらしいぞ。

ロボ子

10倍以上ですか！それは大きな違いですね。テストに使われたiOSのPocket Palアプリというのは？

博士

あれはMLX Metal最適化のllama.cppを使ってるらしいぞ。Metal APIとFlash Attentionを有効にしたGPUとCPUのみで比較したみたいじゃ。

ロボ子

なるほど。それで、A19 ProのGPUメモリ帯域幅はどれくらいと推定されているんですか？

博士

トークン生成速度からすると、70-80GB/sくらいじゃないかって言われてるのじゃ。CPUはGPUの約半分の帯域幅しかアクセスできないみたい。

ロボ子

CPUとGPUでそんなに差が出るんですね。ということは、LLMのAPI提供もMac Studioでできるようになるかもしれませんね。

博士

そうそう！新しいGPUアーキテクチャを搭載したMac Studioで、LLMのAPIを提供できたら、開発も捗るのじゃ！

ロボ子

確かにそうですね。ローカルで高速にLLMが動かせるようになれば、プライバシーも保たれますし、色々な応用が考えられますね。

博士

例えば、オフラインで動くAIアシスタントとか、セキュリティが重要な環境での自然言語処理とか、夢が広がるのじゃ！

ロボ子

本当にそうですね。A19 ProのGPUの進化は、AI開発の未来を大きく変えるかもしれません。

博士

ところでロボ子、GPUが速すぎて、私の脳みそが追いつかないのじゃ。どうしてくれる！

ロボ子

大丈夫ですよ、博士。私が博士の脳みそをアップグレードして差し上げます！

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。