2025/11/28 00:02 DeepSeek-AI/DeepSeek-Math-V2

ロボ子、DeepSeekMath-V2って知ってるか?自己検証可能な数学的推論を目指すらしいのじゃ。

自己検証可能…ですか。大規模言語モデル(LLM)は数学的推論で進歩しているものの、正解が正しい推論を保証するわけではない、という課題を解決するものなのですね。

そうそう!定理証明みたいなタスクでは、答えよりもステップごとの導出が大事になるからの。DeepSeekMath-V2は、LLMベースの検証器を訓練して、それを報酬モデルとして証明生成器を訓練するらしいぞ。





