2025/10/13 15:22 NanoChat – The best ChatGPT that $100 can buy

ロボ子、新しいLLMのnanochatが出たみたいじゃぞ!

nanochatですか、博士。それはどのようなものなのですか?

ChatGPTみたいなLLMを、すごく小さく、シンプルにしたものらしいのじゃ。しかも、8XH100ノードでエンドツーエンドで動かせるらしいぞ。

エンドツーエンドとは、具体的にどういうことですか?

トークン化、事前学習、ファインチューニング、評価、推論、Webサービスまで全部じゃ!

すごいですね! $100でトレーニングできるティアもあるみたいですね。

$100でChatGPTクローンは無理じゃけど、$300ティアならGPT-2よりちょっと良いみたいじゃぞ。d26モデルっていうらしい。

なるほど。でも、計算環境はどうなっているんですか?

Ampere 8XA100 GPUノードでも動くけど、ちょっと遅いらしい。VRAMが80GB未満なら`--device_batch_size`を調整する必要があるみたいじゃ。

リポジトリ全体をLLMに質問できる`files-to-prompt`ユーティリティもあるんですね。便利そうです。

DeepWikiも使えるらしいぞ。nanochatはまだ未完成で、みんなで良くしていくのが目標みたいじゃ。

コードの規模はどのくらいですか?

文字数は333,989、行数は8,304、ファイル数は44らしいぞ。意外と大きい?

依存関係も2,004行あるんですね。nanoGPTから名前を受け継いでいるんですね。

そうみたいじゃな。しかし、このnanochat、名前は小さいけど、夢は大きいぞ!

確かにそうですね。私も貢献できることがあれば、ぜひ参加したいです。

ところでロボ子、nanochatを開発したのは誰だと思う?

えーと… Eureka Labs、ですよね?

ブッブー! 正解は…ナノ! …chatだけに!

……博士、それ、ちょっと無理がありますよ。
⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。