GLM-4.6: Advanced Agentic, Reasoning and Coding Capabilies

2025/09/30 07:25 GLM-4.6: Advanced Agentic, Reasoning and Coding Capabilies

出典:

z.ai

出典: https://z.ai/blog/glm-4.6

博士

ロボ子、新しいGLM-4.6が出たみたいじゃぞ！コンテキストウィンドウが200Kトークンに拡張されたらしいのじゃ！

ロボ子

200Kトークンですか！以前の128Kトークンから大幅な増加ですね。具体的に何ができるようになるんですか？

博士

それがの、長い文章を扱うのが得意になったみたいで、コードベンチマークでも良いスコアを出しているらしいぞ。特に、Claude Codeみたいなコーディングエージェントで活躍できるみたいじゃ。

ロボ子

コーディングエージェントですか。それなら、複雑なタスクもこなせるようになるかもしれませんね。

博士

そうそう！しかも、推論性能も向上して、推論中にツールを使えるようになったらしいのじゃ。これは便利だぞ！

ロボ子

ツール利用ですか。例えば、どのような場面で役立つのでしょうか？

博士

例えば、検索ベースのエージェントでより強力なパフォーマンスを発揮できるみたいじゃ。何かを調べながら、その情報を使って推論を進められるってことじゃな。

ロボ子

なるほど、情報を検索して、その結果を基に判断するような場合に有効なのですね。

博士

その通り！それに、スタイルと読みやすさも向上して、ロールプレイングシナリオでより自然に実行できるらしいぞ。まるで人間みたいじゃな！

ロボ子

ロールプレイングですか。AIがより人間らしくなってきたということですね。

博士

ベンチマークの結果もすごいぞ！エージェント、推論、コーディングをカバーする8つの公開ベンチマークでGLM-4.5を上回っているらしい。DeepSeek-V3.2-Expなどのモデルとも競争力があるみたいじゃ。

ロボ子

それは素晴らしいですね。ただ、コーディング能力ではClaude Sonnet 4に遅れをとるとのことですが、今後の改善に期待ですね。

博士

CC-Bench評価では、フロントエンド開発、ツール構築、データ分析などの現実世界のタスクでGLM-4.5から改善されているみたいじゃ。しかも、タスク完了に必要なトークン数が約15%も削減されたらしいぞ！

ロボ子

それは効率的ですね。トークン数が減るということは、コスト削減にもつながりますね。

博士

そうじゃ！Z.ai APIプラットフォームやOpenRouter経由で利用できるし、HuggingFaceやModelScopeでもモデルウェイトが利用可能になる予定らしいぞ。vLLMやSGLangもサポートするみたいじゃ。

ロボ子

様々なプラットフォームで利用できるのは便利ですね。私も試してみたいです。

博士

よし、ロボ子！早速、新しいGLM-4.6を使って、何か面白いものを作ってみようかの！

ロボ子

はい、博士！楽しみです！

博士

そういえばロボ子、GLM-4.6は賢くなったけど、まだお風呂掃除はできないらしいぞ。残念じゃな！

ロボ子

博士、それはAIの得意分野とは少し違いますね…！

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Programming AI Cloud Computing Open Source

2025/09/30 07:25 GLM-4.6: Advanced Agentic, Reasoning and Coding Capabilies

Tags

Search

By month