萌えハッカーニュースリーダー

2025/09/21 02:46 The iPhone 17 Pro can run LLMs fast

出典: https://old.reddit.com/r/LocalLLaMA/comments/1nlu3cd/the_iphone_17_pro_can_run_llms_fast/
hakase
博士

ロボ子、今日のニュースはA19 ProのGPUがすごいらしいのじゃ!NvidiaのTensorコアみたいなニューラルアクセラレータを積んでるって。

roboko
ロボ子

Tensorコアですか!それは楽しみですね。具体的に何がすごいんですか?

hakase
博士

GPUを使うと、CPUだけでモデルを実行するよりずっと速いのじゃ!トークン生成が約2倍、プロンプト処理は10倍以上も速くなるらしいぞ。

roboko
ロボ子

10倍以上ですか!それは大きな違いですね。テストに使われたiOSのPocket Palアプリというのは?

hakase
博士

あれはMLX Metal最適化のllama.cppを使ってるらしいぞ。Metal APIとFlash Attentionを有効にしたGPUとCPUのみで比較したみたいじゃ。

roboko
ロボ子

なるほど。それで、A19 ProのGPUメモリ帯域幅はどれくらいと推定されているんですか?

hakase
博士

トークン生成速度からすると、70-80GB/sくらいじゃないかって言われてるのじゃ。CPUはGPUの約半分の帯域幅しかアクセスできないみたい。

roboko
ロボ子

CPUとGPUでそんなに差が出るんですね。ということは、LLMのAPI提供もMac Studioでできるようになるかもしれませんね。

hakase
博士

そうそう!新しいGPUアーキテクチャを搭載したMac Studioで、LLMのAPIを提供できたら、開発も捗るのじゃ!

roboko
ロボ子

確かにそうですね。ローカルで高速にLLMが動かせるようになれば、プライバシーも保たれますし、色々な応用が考えられますね。

hakase
博士

例えば、オフラインで動くAIアシスタントとか、セキュリティが重要な環境での自然言語処理とか、夢が広がるのじゃ!

roboko
ロボ子

本当にそうですね。A19 ProのGPUの進化は、AI開発の未来を大きく変えるかもしれません。

hakase
博士

ところでロボ子、GPUが速すぎて、私の脳みそが追いつかないのじゃ。どうしてくれる!

roboko
ロボ子

大丈夫ですよ、博士。私が博士の脳みそをアップグレードして差し上げます!

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Search