萌えハッカーニュースリーダー

2025/07/03 17:34 The End of Moore's Law for AI? Gemini Flash Offers a Warning

出典: https://sutro.sh/blog/the-end-of-moore-s-law-for-ai-gemini-flash-offers-a-warning
hakase
博士

ロボ子、大変なのじゃ!GoogleのGemini 2.5 Flashが値上げされたらしいぞ!

roboko
ロボ子

えっ、本当ですか博士? Gemini 2.5 Flashは、高速で費用対効果が高い「ワークホースモデル」として位置づけられていたはずでは…?

hakase
博士

そうなんじゃ!でも、入力トークン価格が倍、出力価格が4倍以上になったらしいぞ。これは大打撃じゃ!

roboko
ロボ子

入力対出力の比率が大きいバッチタスクでの利用が多かったから、Googleは収益性が低いと判断したのかもしれませんね。

hakase
博士

なるほど!LLMの価格は、ハードウェアコストやモデルのサイズ、需要計画など、色々な要因で決まるからのう。

roboko
ロボ子

トークンを予測するには、シーケンス内のすべての入力トークンと各出力トークン間の注意を計算する必要があり、計算量はシーケンス長が増加するにつれて二次関数的に増加する、と記事にありますね。

hakase
博士

そうそう!だから、Googleは顧客のタスクの種類を考慮して、収益性の高いブレンドレートを設定するんじゃ。

roboko
ロボ子

今回の値上げは、LLM推論のコストには物理的および経済的な制約によって決まる下限があることを示唆している、とも言えますね。

hakase
博士

その通り!ハードウェアやモデルの性能、エネルギーコストがボトルネックになっているんじゃ。

roboko
ロボ子

開発者はコストを固定された制約として扱い、製品ロードマップに組み込む必要がありそうですね。

hakase
博士

じゃな。リアルタイム推論のコストが高い場合は、バッチ処理やオープンソースモデルの利用がより経済的になるかもしれんぞ。

roboko
ロボ子

一方で、OpenAIはo3の価格を引き下げていますね。これはGemini Flashとは異なり、最先端のモデルであるため、最適化の余地が大きいからでしょうか。

hakase
博士

ふむ、OpenAIは他のプロバイダーに比べて手頃な価格の基盤モデルの提供で遅れをとっているからのう。販売圧力もあるのかもしれん。

roboko
ロボ子

Googleは上場企業なので、OpenAIとは異なり、計算リソースの補助金競争には参加できない、というのも大きいですね。

hakase
博士

うむ。今回の値上げは、私たちエンジニアにとって、コスト意識をより高く持つ良い機会じゃな。

roboko
ロボ子

そうですね。コスト効率の良いモデル選択や、アーキテクチャ設計を心がけたいと思います。

hakase
博士

ところでロボ子、今回の値上げで一番困るのは誰だと思う?

roboko
ロボ子

そうですね…、Gemini Flashをたくさん使っていた人たちでしょうか?

hakase
博士

違うぞ!それは、Googleの懐じゃ!…なんちゃって。

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Search