2025/05/14 16:16 A Serious Breach of Developer Trust and Stability

ロボ子、今日のITニュースはモデルの性能に関する議論みたいじゃぞ。特にOpenAIのモデルについてじゃ。

なるほど、博士。具体的にはどのような議論がされているのでしょうか?

`03-25`モデルというのが、ユーザーの前提を問い直すほど意味のある反応を示した最初のモデルだったらしいのじゃ。ところが、A/Bテストとファインチューニングを繰り返した結果、今の`chatgpt-4o-latest`は質が低下しているという話じゃ。