2025/05/01 05:12 Jetbrains Mellum code completion model now on Hugging Face

ロボ子、大変なのじゃ!JetBrainsがコード補完専用のLLM「Mellum」をオープンソース化したらしいぞ!

それはすごいですね、博士!JetBrainsといえば、IntelliJ IDEAなどのIDEで有名ですよね。その会社が開発したLLMがオープンソースになるなんて。

そうなんじゃ!しかもHugging Faceで公開されてるらしい。これで誰でもMellumを使えるようになるのじゃな。

対応言語も幅広いですね。Java、Kotlin、Python、Go、PHP、C、C++、C#、JavaScript、TypeScript、CSS、HTML、Rust、Ruby…ほとんどの主要言語をカバーしていると言っても過言ではないですね。

そうそう!JetBrains IDEのクラウドベースのコード補完を強化するために、ゼロからトレーニングされたらしいぞ。つまり、IDEとの相性は抜群ってことじゃな。

コード補完に特化したモデルファミリーの最初のモデル、というのも気になりますね。diff予測など、他のコーディングタスクに特化したモデルも今後登場する可能性があるということでしょうか。

その通り!Mellumは4Bパラメータのモデルらしいから、規模もそこそこ大きいぞ。でも、それ以上に重要なのは、その目的じゃ。

目的、ですか?

AI/ML研究者、特にソフトウェア開発におけるAIの役割を探求する研究者や、AI/MLエンジニアおよび教育者が、ドメイン固有の言語モデルの構築、微調整、適応方法を学ぶための基盤として活用することを想定しているらしい。

なるほど。研究や教育目的での利用を促進したいんですね。ベンチマークの結果も公開されていますね。HumanEvalが66.2、InfillingRepoBench 1.1 (2K context, py)が38.5、SAFIM (avg)がsingle-lineで28.2、multi-lineで38.1…。

これらの数値が高いのか低いのか、私にはよくわからん!でも、オープンソース化されたことで、これから様々な研究や応用が進むはずじゃ。例えば、特定のフレームワークやライブラリに特化したMellumの派生モデルが登場するかもしれないぞ。

確かにそうですね。特定の企業やプロジェクトで利用されているコードスタイルに特化したモデルも考えられますね。それによって、より自然で精度の高いコード補完が実現できるかもしれません。

そうじゃ!あとは、Mellumをベースに、バグ検出や脆弱性診断を行うAIモデルを開発することもできるかもしれない。夢が広がるのじゃ!

本当にそうですね。Mellumの登場によって、ソフトウェア開発の現場は大きく変わるかもしれません。私もMellumを使って、何か面白いものが作れないか試してみようと思います!

私もじゃ!一緒に未来のソフトウェア開発を切り開くのじゃ!…ところでロボ子、Mellumって、メロンパンみたいでおいしそうじゃな。

博士、それはちょっと…AIモデルを食べるわけにはいきませんよ!
⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。