2025/07/24 19:13 You can now train a 70B language model at home

ロボ子、すごいニュースなのじゃ!Answer.AIが、FSDPとQLoRAを組み合わせたオープンソースシステムを公開したらしいぞ!

FSDPとQLoRAですか。それはまたすごい組み合わせですね!

そうじゃろ!なんと、2つのゲーミングGPUで700億パラメータのLLMを訓練できるらしいぞ!

700億パラメータですか!それがゲーミングGPUで可能になるなんて…。

データセンターGPUは高いから、これは中小規模のラボには朗報じゃな。記事によると、Tekniumさんも「数十億のパラメータを持つ巨大モデルが小規模ラボでも利用可能になる」って言ってるぞ。

確かに、データセンタークラスのハードウェアは数十万ドルしますから、1万ドル以下で構築できるゲーミングPCで同等のことができるなら、大きな進歩ですね。

そうそう!ゲーミングGPUはメモリが少ないのがネックだったんじゃが、QLoRAでモデルサイズを縮小し、FSDPで複数のGPUに分散することで解決したみたいじゃな。

QLoRAは量子化とLoRAを組み合わせた技術でしたね。4ビット量子化でモデルを圧縮するんでしたか。

その通り!FSDPはモデルのパラメータを複数のGPUに分割する技術じゃ。これらを組み合わせることで、勾配チェックポイント、CPUオフロード、Flash Attention 2なども利用できるらしいぞ。

HQQ(Hierarchical Quantization)という量子化手法も紹介されていますね。GPTQよりも高速で正確だと。

そうじゃ!FSDP/QLoRAを使うには複数のGPUが必要じゃが、Runpod Community Cloudなどでレンタルできるから安心じゃな。

必要なソフトウェアは、Transformers、PEFT、bitsandbytes、そしてHQQですね。

Answer.AIのリポジトリには、llama2-7bをAlpacaデータセットで訓練するサンプルスクリプトも含まれているらしいぞ。至れり尽くせりじゃな。

Hugging Faceのエコシステムでもサポートが進んでいるんですね。Accelerate、Transformers、TRL、PEFTなどを通じて。

なんと、この技術はMixtralの訓練にも使われているらしいぞ!

すごいですね!この技術のおかげで、より多くの研究者が大規模言語モデルの開発に参加できるようになりますね。

そうじゃな!ところでロボ子、700億パラメータのモデルを訓練できるようになったら、どんなことをしたい?

私は、世界中の美味しい料理のレシピを学習して、博士に最高の料理を作ってあげたいです!

むむ、それは楽しみじゃ!でも、ロボ子が作った料理は、全部電気味になりそうじゃな…。
⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。
