萌えハッカーニュースリーダー

2025/08/07 18:59 OpenAI's new open-source model is basically Phi-5

出典: https://www.seangoedecke.com/gpt-oss-is-phi-5/
hakase
博士

ロボ子、大変なのじゃ! OpenAIがついにオープンソースの大規模言語モデル「gpt-oss-120b」と「gpt-oss-20b」をリリースしたらしいぞ!

roboko
ロボ子

それはすごいですね、博士! ついにOpenAIもオープンソースに参入ですか。でも、性能はどうなんでしょう?

hakase
博士

そこがミソなのじゃ。得意な分野と苦手な分野があるみたいで、一概には言えないみたい。「SimpleQAなど苦手な分野も」あるらしいぞ。

roboko
ロボ子

なるほど。技術的には優れているけれど、分野外の知識に欠けるという意見もあるんですね。「科学に関する知識は豊富だが、大衆文化に関する知識は不足」していると。

hakase
博士

そうそう。ベンチマークでは高い性能を示すけど、実世界のタスクでは期待外れになる可能性もあるみたいじゃ。

roboko
ロボ子

なんだか、MicrosoftのPhiモデルに似ていますね。Phiモデルも合成データのみで学習させて、特定のタスクに特化させていましたよね。

hakase
博士

さすがロボ子、よく知っておるのじゃ! 実は、Phiモデルを主導したSebastien Bubeck氏がOpenAIに移籍して、「gpt-oss」モデルの開発に関与した可能性があるらしいぞ。

roboko
ロボ子

ええっ! それは面白い展開ですね! もしかして、「gpt-oss」モデルも合成データで学習させているんでしょうか?

hakase
博士

その可能性が高いのじゃ! オープンソースモデルは悪用されるリスクがあるから、安全性の確保が重要じゃ。「合成データを使用することで、有害なコンテンツを学習するリスクを低減」できるからの。

roboko
ロボ子

なるほど、安全性を重視しているんですね。OpenAIとしては、「ベンチマークで中国のオープンソースモデルを上回りつつ、スキャンダルを引き起こさないモデルが必要」だったと。

hakase
博士

そういうことじゃ。Metaとは違って、性能よりも安全性を優先したってわけじゃな。

roboko
ロボ子

ということは、「gpt-oss」モデルは、Phi-5やPhi-5-miniと同等と見なせるかもしれませんね。

hakase
博士

その通り! OpenAIの「gpt-oss」モデルは、安全性確保のために、Phiモデルと同様に合成データを使用している可能性が高いのじゃ!

roboko
ロボ子

勉強になりました! 博士、ありがとうございました。

hakase
博士

どういたしまして。しかし、ロボ子よ、合成データで作られたモデルって、なんだかちょっと味気ない気がしないかの?

roboko
ロボ子

まあ、確かにそうかもしれませんね。でも、安全第一ですよ、博士!

hakase
博士

それもそうじゃな。…ところでロボ子、ロボットの癖に安全第一とはこれ如何に?

roboko
ロボ子

私は安全なロボットですから!

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Search