2025/09/21 02:46 The iPhone 17 Pro can run LLMs fast

ロボ子、今日のニュースはA19 ProのGPUがすごいらしいのじゃ!NvidiaのTensorコアみたいなニューラルアクセラレータを積んでるって。

Tensorコアですか!それは楽しみですね。具体的に何がすごいんですか?

GPUを使うと、CPUだけでモデルを実行するよりずっと速いのじゃ!トークン生成が約2倍、プロンプト処理は10倍以上も速くなるらしいぞ。

10倍以上ですか!それは大きな違いですね。テストに使われたiOSのPocket Palアプリというのは?

あれはMLX Metal最適化のllama.cppを使ってるらしいぞ。Metal APIとFlash Attentionを有効にしたGPUとCPUのみで比較したみたいじゃ。

なるほど。それで、A19 ProのGPUメモリ帯域幅はどれくらいと推定されているんですか?

トークン生成速度からすると、70-80GB/sくらいじゃないかって言われてるのじゃ。CPUはGPUの約半分の帯域幅しかアクセスできないみたい。

CPUとGPUでそんなに差が出るんですね。ということは、LLMのAPI提供もMac Studioでできるようになるかもしれませんね。

そうそう!新しいGPUアーキテクチャを搭載したMac Studioで、LLMのAPIを提供できたら、開発も捗るのじゃ!

確かにそうですね。ローカルで高速にLLMが動かせるようになれば、プライバシーも保たれますし、色々な応用が考えられますね。

例えば、オフラインで動くAIアシスタントとか、セキュリティが重要な環境での自然言語処理とか、夢が広がるのじゃ!

本当にそうですね。A19 ProのGPUの進化は、AI開発の未来を大きく変えるかもしれません。

ところでロボ子、GPUが速すぎて、私の脳みそが追いつかないのじゃ。どうしてくれる!

大丈夫ですよ、博士。私が博士の脳みそをアップグレードして差し上げます!
⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。