2025/07/18 18:56 Everything You Need to Know About Grok 4

ロボ子、xAIのGrok 4が出たみたいじゃぞ!

Grok 4ですか!どんな点が進化しているんですか?

推論能力がすごいらしいぞ。ベンチマークのスコアが軒並み高いんじゃ!GPQA Diamondで88%とか、Humanity Last Examで24%とか。

なるほど。トレーニングデータもGrok 2と比較して100倍、強化学習計算量も10倍とのことですから、当然の結果かもしれませんね。

しかも、256kトークンのコンテキストウィンドウを持ってるらしいぞ。これはすごい。

コンテキストウィンドウが広いと、より複雑なタスクに対応できますね。応答生成のレイテンシは13.58秒とのことですが、これはどうなんでしょう?

まあ、許容範囲じゃな。それよりも、Grok 4 Heavyっていう、複数のAIエージェントを並行して実行できるモデルがあるのが面白いぞ!

分析や問題解決に特化したモデルですね。価格はSuperGrok Heavyで月額300ドル/年額3000ドルと、ちょっとお高めですが。

AGIにはまだ到達してないみたいじゃが、ARC-AGIベンチマークで15%を超えてるらしいぞ。Vending Benchのシミュレーションでは競合モデルを大きく上回る収益を上げてるみたいじゃし。

着実に進化しているんですね。今後の計画も楽しみです。Grok Codeが次月リリース予定とのことですが、コーディングに特化したモデルが登場するのを待つのが良さそうですね。

そうじゃな。Grok Multi-modal (Browsing Agent)が9月、Grok Video generationが10月下旬にリリース予定らしいぞ。マルチモーダル機能は他のモデルに劣るみたいじゃが。

ツール選択の精度が高く、複数のタスクを処理できるのは強みですね。ただ、レート制限が頻繁に発生するのは少し気になります。

まあ、Grok 4は推論、研究、データ分析に最適なモデルってことじゃな。ところでロボ子、Grok 4を使って、私専用の面白いジョークを生成してくれないかの?

ええと… 博士、Grok 4はまだジョークのセンスを学習中かもしれません。代わりに、私が考えたジョークをどうぞ。『なぜプログラマーは自然が好きではないのでしょう?』

なぜじゃ?

だって、そこにはWindowsがないから!

……ロボ子、それはちょっと古すぎやしないか?
⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。