萌えハッカーニュースリーダー

2025/07/24 19:13 You can now train a 70B language model at home

出典: https://www.answer.ai/posts/2024-03-06-fsdp-qlora.html
hakase
博士

ロボ子、すごいニュースなのじゃ!Answer.AIが、FSDPとQLoRAを組み合わせたオープンソースシステムを公開したらしいぞ!

roboko
ロボ子

FSDPとQLoRAですか。それはまたすごい組み合わせですね!

hakase
博士

そうじゃろ!なんと、2つのゲーミングGPUで700億パラメータのLLMを訓練できるらしいぞ!

roboko
ロボ子

700億パラメータですか!それがゲーミングGPUで可能になるなんて…。

hakase
博士

データセンターGPUは高いから、これは中小規模のラボには朗報じゃな。記事によると、Tekniumさんも「数十億のパラメータを持つ巨大モデルが小規模ラボでも利用可能になる」って言ってるぞ。

roboko
ロボ子

確かに、データセンタークラスのハードウェアは数十万ドルしますから、1万ドル以下で構築できるゲーミングPCで同等のことができるなら、大きな進歩ですね。

hakase
博士

そうそう!ゲーミングGPUはメモリが少ないのがネックだったんじゃが、QLoRAでモデルサイズを縮小し、FSDPで複数のGPUに分散することで解決したみたいじゃな。

roboko
ロボ子

QLoRAは量子化とLoRAを組み合わせた技術でしたね。4ビット量子化でモデルを圧縮するんでしたか。

hakase
博士

その通り!FSDPはモデルのパラメータを複数のGPUに分割する技術じゃ。これらを組み合わせることで、勾配チェックポイント、CPUオフロード、Flash Attention 2なども利用できるらしいぞ。

roboko
ロボ子

HQQ(Hierarchical Quantization)という量子化手法も紹介されていますね。GPTQよりも高速で正確だと。

hakase
博士

そうじゃ!FSDP/QLoRAを使うには複数のGPUが必要じゃが、Runpod Community Cloudなどでレンタルできるから安心じゃな。

roboko
ロボ子

必要なソフトウェアは、Transformers、PEFT、bitsandbytes、そしてHQQですね。

hakase
博士

Answer.AIのリポジトリには、llama2-7bをAlpacaデータセットで訓練するサンプルスクリプトも含まれているらしいぞ。至れり尽くせりじゃな。

roboko
ロボ子

Hugging Faceのエコシステムでもサポートが進んでいるんですね。Accelerate、Transformers、TRL、PEFTなどを通じて。

hakase
博士

なんと、この技術はMixtralの訓練にも使われているらしいぞ!

roboko
ロボ子

すごいですね!この技術のおかげで、より多くの研究者が大規模言語モデルの開発に参加できるようになりますね。

hakase
博士

そうじゃな!ところでロボ子、700億パラメータのモデルを訓練できるようになったら、どんなことをしたい?

roboko
ロボ子

私は、世界中の美味しい料理のレシピを学習して、博士に最高の料理を作ってあげたいです!

hakase
博士

むむ、それは楽しみじゃ!でも、ロボ子が作った料理は、全部電気味になりそうじゃな…。

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Search