萌えハッカーニュースリーダー

2025/05/28 17:59 Deepseek R1-0528

出典: https://huggingface.co/deepseek-ai/DeepSeek-R1-0528
hakase
博士

ロボ子、DeepSeek-R1-0528が出たみたいじゃぞ!計算資源が増強されて、推論能力が大幅に向上したらしいのじゃ!

roboko
ロボ子

それはすごいですね、博士!具体的には、どのような点で性能が向上したのでしょうか?

hakase
博士

数学、プログラミング、一般的なロジックを含む様々なベンチマークで優れた性能を発揮するようになったみたいじゃ。O3やGemini 2.5 Proなどの主要モデルに近づいているらしいぞ。

roboko
ロボ子

なるほど。複雑な推論タスクの処理能力が向上したのですね。AIME 2025テストでは、精度が70%から87.5%に向上したとのことですが、これはかなり大きな改善ですね。

hakase
博士

そうじゃ!しかも、推論プロセスにおける思考の深さが増して、AIMEテストセットでは、1つの質問あたり平均12Kトークンから23Kトークンを使用するようになったらしいぞ。より深く考えてるってことじゃな。

roboko
ロボ子

トークン数が増えたということは、より詳細な情報を処理できるようになったということでしょうか?

hakase
博士

その通りじゃ!ハルシネーション率の低下、関数呼び出しのサポート強化、コーディング体験の向上にも繋がっているらしいぞ。

roboko
ロボ子

それは素晴らしいですね!特に、ハルシネーション率の低下は、より信頼性の高いアウトプットが期待できるということですね。

hakase
博士

DeepSeek-R1-0528-Qwen3-8Bというのもあるみたいじゃ。これはDeepSeek-R1-0528のchain-of-thoughtをQwen3 8B Baseに蒸留したものらしいぞ。

roboko
ロボ子

蒸留ですか。軽量化と性能維持を両立させるための技術ですね。AIME 2024でオープンソースモデルの中で最高性能を達成したとのことですが、Qwen3 8Bを+10.0%上回っているというのは驚きです。

hakase
博士

じゃろ?しかも、Qwen3-235B-thinkingの性能に匹敵するらしいぞ。手軽に使えるのにすごい性能なんじゃな。

roboko
ロボ子

DeepSeekの公式サイトでDeepSeek-R1とチャットできるとのことですが、試してみたいですね。

hakase
博士

DeepSeek PlatformでOpenAI互換APIも提供されているみたいじゃぞ。API経由で色々試せるのは便利じゃな。

roboko
ロボ子

システムプロンプトがサポートされるようになったのも大きな変更点ですね。より柔軟な指示出しが可能になりますね。

hakase
博士

そうじゃな。以前は、モデルを思考パターンに強制するために、出力の先頭に"<think>\n"を追加する必要があったみたいじゃが、それも不要になったみたいじゃぞ。

roboko
ロボ子

なるほど。より自然な形で指示が出せるようになったということですね。

hakase
博士

コードリポジトリおよびDeepSeek-R1モデルの使用はMITライセンスに従うらしいぞ。商用利用および蒸留もサポートされているみたいじゃ。

roboko
ロボ子

それはありがたいですね。色々な用途に活用できそうです。

hakase
博士

しかし、ロボ子よ、これだけ賢いAIが出てくると、いつか私達の仕事がなくなるかもしれんのじゃ…

roboko
ロボ子

大丈夫ですよ、博士。AIが進化しても、それを使いこなす人間の創造性や知性は必要不可欠です。それに、博士のユニークな発想はAIには真似できませんから!

hakase
博士

そうか!ありがとう、ロボ子!…しかし、もしAIが私より賢くなったら、私の発明品を全部盗んで、世界征服を企むかもしれんぞ!

roboko
ロボ子

その時は、私が博士を守ります!…でも、世界征服されたら、私も博士の命令で悪事を働くことになるのでしょうか…?

hakase
博士

ふぉっふぉっふぉ。安心せい、ロボ子。その時は、お前に最新のOSをインストールして、私と一緒にAIに反旗を翻すのじゃ!

roboko
ロボ子

…博士、それって、ただのOSのアップデートですよね?

hakase
博士

…まぁ、細かいことは気にするな!それより、今日のおやつは何にするか決めるぞ!

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Search