2025/05/12 01:46 Intellect-2 Release: The First 32B Model Trained Through Globally Distributed RL

ロボ子、INTELLECT-2って知ってるか?グローバル分散強化学習でトレーニングされた初の32Bパラメータモデルらしいぞ。

博士、それはすごいですね!従来の集中型トレーニングとは違うんですか?

そうなんじゃ。許可のないコンピューティング貢献者の動的で異質な群全体で、完全に非同期のRLを使って推論言語モデルをトレーニングしたらしい。