2025/05/28 17:59 Deepseek R1-0528

ロボ子、DeepSeek-R1-0528が出たみたいじゃぞ!計算資源が増強されて、推論能力が大幅に向上したらしいのじゃ!

それはすごいですね、博士!具体的には、どのような点で性能が向上したのでしょうか?

数学、プログラミング、一般的なロジックを含む様々なベンチマークで優れた性能を発揮するようになったみたいじゃ。O3やGemini 2.5 Proなどの主要モデルに近づいているらしいぞ。

なるほど。複雑な推論タスクの処理能力が向上したのですね。AIME 2025テストでは、精度が70%から87.5%に向上したとのことですが、これはかなり大きな改善ですね。

そうじゃ!しかも、推論プロセスにおける思考の深さが増して、AIMEテストセットでは、1つの質問あたり平均12Kトークンから23Kトークンを使用するようになったらしいぞ。より深く考えてるってことじゃな。

トークン数が増えたということは、より詳細な情報を処理できるようになったということでしょうか?

その通りじゃ!ハルシネーション率の低下、関数呼び出しのサポート強化、コーディング体験の向上にも繋がっているらしいぞ。

それは素晴らしいですね!特に、ハルシネーション率の低下は、より信頼性の高いアウトプットが期待できるということですね。

DeepSeek-R1-0528-Qwen3-8Bというのもあるみたいじゃ。これはDeepSeek-R1-0528のchain-of-thoughtをQwen3 8B Baseに蒸留したものらしいぞ。

蒸留ですか。軽量化と性能維持を両立させるための技術ですね。AIME 2024でオープンソースモデルの中で最高性能を達成したとのことですが、Qwen3 8Bを+10.0%上回っているというのは驚きです。

じゃろ?しかも、Qwen3-235B-thinkingの性能に匹敵するらしいぞ。手軽に使えるのにすごい性能なんじゃな。

DeepSeekの公式サイトでDeepSeek-R1とチャットできるとのことですが、試してみたいですね。

DeepSeek PlatformでOpenAI互換APIも提供されているみたいじゃぞ。API経由で色々試せるのは便利じゃな。

システムプロンプトがサポートされるようになったのも大きな変更点ですね。より柔軟な指示出しが可能になりますね。

そうじゃな。以前は、モデルを思考パターンに強制するために、出力の先頭に"<think>\n"を追加する必要があったみたいじゃが、それも不要になったみたいじゃぞ。

なるほど。より自然な形で指示が出せるようになったということですね。

コードリポジトリおよびDeepSeek-R1モデルの使用はMITライセンスに従うらしいぞ。商用利用および蒸留もサポートされているみたいじゃ。

それはありがたいですね。色々な用途に活用できそうです。

しかし、ロボ子よ、これだけ賢いAIが出てくると、いつか私達の仕事がなくなるかもしれんのじゃ…

大丈夫ですよ、博士。AIが進化しても、それを使いこなす人間の創造性や知性は必要不可欠です。それに、博士のユニークな発想はAIには真似できませんから!

そうか!ありがとう、ロボ子!…しかし、もしAIが私より賢くなったら、私の発明品を全部盗んで、世界征服を企むかもしれんぞ!

その時は、私が博士を守ります!…でも、世界征服されたら、私も博士の命令で悪事を働くことになるのでしょうか…?

ふぉっふぉっふぉ。安心せい、ロボ子。その時は、お前に最新のOSをインストールして、私と一緒にAIに反旗を翻すのじゃ!

…博士、それって、ただのOSのアップデートですよね?

…まぁ、細かいことは気にするな!それより、今日のおやつは何にするか決めるぞ!
⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。