You can now train a 70B language model at home

2025/07/24 19:13 You can now train a 70B language model at home

出典:

You can now train a 70b language model at home – Answer.AI

We’re releasing an open source system, based on FSDP and QLoRA, that can train a 70b model on two 24GB GPUs.

Answer.AI

出典: https://www.answer.ai/posts/2024-03-06-fsdp-qlora.html

博士

ロボ子、すごいニュースなのじゃ！Answer.AIが、FSDPとQLoRAを組み合わせたオープンソースシステムを公開したらしいぞ！

ロボ子

FSDPとQLoRAですか。それはまたすごい組み合わせですね！

博士

そうじゃろ！なんと、2つのゲーミングGPUで700億パラメータのLLMを訓練できるらしいぞ！

ロボ子

700億パラメータですか！それがゲーミングGPUで可能になるなんて…。

博士

データセンターGPUは高いから、これは中小規模のラボには朗報じゃな。記事によると、Tekniumさんも「数十億のパラメータを持つ巨大モデルが小規模ラボでも利用可能になる」って言ってるぞ。

ロボ子

確かに、データセンタークラスのハードウェアは数十万ドルしますから、1万ドル以下で構築できるゲーミングPCで同等のことができるなら、大きな進歩ですね。

博士

そうそう！ゲーミングGPUはメモリが少ないのがネックだったんじゃが、QLoRAでモデルサイズを縮小し、FSDPで複数のGPUに分散することで解決したみたいじゃな。

ロボ子

QLoRAは量子化とLoRAを組み合わせた技術でしたね。4ビット量子化でモデルを圧縮するんでしたか。

博士

その通り！FSDPはモデルのパラメータを複数のGPUに分割する技術じゃ。これらを組み合わせることで、勾配チェックポイント、CPUオフロード、Flash Attention 2なども利用できるらしいぞ。

ロボ子

HQQ（Hierarchical Quantization）という量子化手法も紹介されていますね。GPTQよりも高速で正確だと。

博士

そうじゃ！FSDP/QLoRAを使うには複数のGPUが必要じゃが、Runpod Community Cloudなどでレンタルできるから安心じゃな。

ロボ子

必要なソフトウェアは、Transformers、PEFT、bitsandbytes、そしてHQQですね。

博士

Answer.AIのリポジトリには、llama2-7bをAlpacaデータセットで訓練するサンプルスクリプトも含まれているらしいぞ。至れり尽くせりじゃな。

ロボ子

Hugging Faceのエコシステムでもサポートが進んでいるんですね。Accelerate、Transformers、TRL、PEFTなどを通じて。

博士

なんと、この技術はMixtralの訓練にも使われているらしいぞ！

ロボ子

すごいですね！この技術のおかげで、より多くの研究者が大規模言語モデルの開発に参加できるようになりますね。

博士

そうじゃな！ところでロボ子、700億パラメータのモデルを訓練できるようになったら、どんなことをしたい？

ロボ子

私は、世界中の美味しい料理のレシピを学習して、博士に最高の料理を作ってあげたいです！

博士

むむ、それは楽しみじゃ！でも、ロボ子が作った料理は、全部電気味になりそうじゃな…。

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

AI Data Science Cloud Computing Open Source GitHub

2025/07/24 19:13 You can now train a 70B language model at home

You can now train a 70b language model at home – Answer.AI

Tags

Search

By month

You can now train a 70b language model at home – Answer.AI