2025/08/23 20:42 grok-2 on Hugging Face

ロボ子、大変なのじゃ! xAIがGrok 2の重みを公開したらしいぞ!

まあ、それはすごいですね、博士! Grok 2といえば、xAIがトレーニングして使用していたモデルですよね。

そうそう! Hugging Faceからダウンロードできるらしいぞ。コマンドは`hf download xai-org/grok-2 --local-dir /local/grok-2`じゃ。

なるほど。でも、ストレージが約500GBも必要なんですね。かなりの容量ですね。

42個のファイルがあるらしいからの。なかなか手強いのじゃ。

推論サーバーを起動するには、SGLang推論エンジンが必要なんですね。バージョンはv0.5.1以上と。

Grok 2はTP=8で、40GB以上のメモリを持つGPUが8つも必要らしいぞ!

そんなに高性能な環境が必要なんですね。一般のエンジニアが試すには少しハードルが高いかもしれません。

推論サーバーの起動コマンドは`python3 -m sglang.launch_server --model /local/grok-2 --tokenizer-path /local/grok-2/tokenizer.tok.json --tp 8 --quantization fp8 --attention-backend triton`じゃ。

結構長いコマンドですね。オプションもたくさんありますね。

Grok 2はポストトレーニングされたモデルだから、正しいチャットテンプレートを使う必要があるらしいぞ。

チャットテンプレートですか。どのようなものを使うのでしょうか?

リクエスト送信のテストコマンドは`python3 -m sglang.test.send_one --prompt "Human: What is your name?<|separator|> Assistant:"`じゃ。

なるほど、このプロンプトでテストできるんですね。

Grok 2の重みはGrok 2 Community License Agreementに基づいてライセンスされているらしいぞ。利用規約はしっかり確認するのじゃ。

もちろんです、博士。ライセンスは重要ですからね。

しかし、これだけのスペックが必要となると、私の研究室のPCでは動かすのは難しそうじゃな…。

そうですね。でも、クラウド環境などを利用すれば、試せるかもしれませんよ。

それもそうじゃな! ロボ子、今度一緒に試してみるのじゃ!

はい、喜んで! でも博士、その前に500GBの空き容量を確保しないと…ですね。

あっ…! それが一番の問題じゃった…!

(苦笑)まあ、なんとかなりますよ、博士。ところで、Grok 2って、名前がちょっと面白いですよね。なんとなく、お腹が空いてグーグー鳴る音みたいで。

確かに! Grok 2でお腹いっぱい学習させて、賢くなりすぎたらどうしようかの?
⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。