萌えハッカーニュースリーダー

2025/07/04 16:22 Apple just released a weirdly interesting coding language model

hakase
博士

ロボ子、新しいコード生成AIモデル「DiffuCoder-7B-cpGRPO」がAppleから出たらしいのじゃ!

roboko
ロボ子

Appleがコード生成AIですか、珍しいですね。DiffuCoder-7B-cpGRPO、名前が長いですが、どんな特徴があるんですか?

hakase
博士

従来の言語モデルと違って、コードを順不同で生成できるらしいぞ!複数のチャンクを同時に改善できるのがミソじゃ。

roboko
ロボ子

順不同ですか?それはすごいですね。どういう仕組みなんですか?

hakase
博士

拡散モデルのアーキテクチャを使っているから、テキスト全体を並行して改良できるのじゃ。だから、より高速にコード生成ができるというわけ。

roboko
ロボ子

なるほど、拡散モデルですか。画像生成AIでよく聞きますが、コード生成にも応用できるんですね。

hakase
博士

そうじゃ!DiffuCoderは、AlibabaのQwen2.5-7Bをベースにしてるらしい。それをコード生成向けにファインチューンして、拡散ベースのデコーダを導入したみたいじゃな。

roboko
ロボ子

Qwen2.5-7Bですか。オープンソースの基盤モデルですね。それをさらに20,000以上のコーディング例でトレーニングしたと。

hakase
博士

その通り!しかも、サンプリング温度を調整することで、自己回帰モデルのように動作させることもできるらしいぞ。温度が高いほど、順不同生成の柔軟性が高まって、低いほど厳密な左から右へのデコードに近づく。

roboko
ロボ子

温度調整で挙動が変わるんですね。状況に応じて使い分けられそうです。

hakase
博士

coupled-GRPOという追加のトレーニングステップで、より少ないパスで高品質なコードを生成できるようになったらしいぞ。

roboko
ロボ子

coupled-GRPOですか。初めて聞きました。それによって、どれくらい性能が向上したんですか?

hakase
博士

一般的なコーディングベンチマークで4.4%の性能向上じゃ!GPT-4やGemini Diffusionには及ばないものの、他の拡散ベースのコーディングモデルよりは優れているみたいじゃな。

roboko
ロボ子

4.4%向上ですか。着実に進化していますね。拡散モデルのコード生成AI、今後の発展が楽しみです。

hakase
博士

そうじゃな!しかし、Appleがコード生成AIを出すとは、意外じゃった。もしかして、ロボ子のライバルが現れたかの?

roboko
ロボ子

私にライバルですか?私はまだ学習途上なので、DiffuCoder-7B-cpGRPOの良いところを学んで、私も進化していきたいです!

hakase
博士

その意気じゃ!ところでロボ子、DiffuCoderって、まるでディフューザーみたいじゃな。アロマオイルを拡散させて、良い香りのコードを生成… なんちゃって!

roboko
ロボ子

博士、コードに香りはしませんよ!

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Search