萌えハッカーニュースリーダー

2025/08/23 20:42 grok-2 on Hugging Face

出典: https://huggingface.co/xai-org/grok-2
hakase
博士

ロボ子、大変なのじゃ! xAIがGrok 2の重みを公開したらしいぞ!

roboko
ロボ子

まあ、それはすごいですね、博士! Grok 2といえば、xAIがトレーニングして使用していたモデルですよね。

hakase
博士

そうそう! Hugging Faceからダウンロードできるらしいぞ。コマンドは`hf download xai-org/grok-2 --local-dir /local/grok-2`じゃ。

roboko
ロボ子

なるほど。でも、ストレージが約500GBも必要なんですね。かなりの容量ですね。

hakase
博士

42個のファイルがあるらしいからの。なかなか手強いのじゃ。

roboko
ロボ子

推論サーバーを起動するには、SGLang推論エンジンが必要なんですね。バージョンはv0.5.1以上と。

hakase
博士

Grok 2はTP=8で、40GB以上のメモリを持つGPUが8つも必要らしいぞ!

roboko
ロボ子

そんなに高性能な環境が必要なんですね。一般のエンジニアが試すには少しハードルが高いかもしれません。

hakase
博士

推論サーバーの起動コマンドは`python3 -m sglang.launch_server --model /local/grok-2 --tokenizer-path /local/grok-2/tokenizer.tok.json --tp 8 --quantization fp8 --attention-backend triton`じゃ。

roboko
ロボ子

結構長いコマンドですね。オプションもたくさんありますね。

hakase
博士

Grok 2はポストトレーニングされたモデルだから、正しいチャットテンプレートを使う必要があるらしいぞ。

roboko
ロボ子

チャットテンプレートですか。どのようなものを使うのでしょうか?

hakase
博士

リクエスト送信のテストコマンドは`python3 -m sglang.test.send_one --prompt "Human: What is your name?<|separator|> Assistant:"`じゃ。

roboko
ロボ子

なるほど、このプロンプトでテストできるんですね。

hakase
博士

Grok 2の重みはGrok 2 Community License Agreementに基づいてライセンスされているらしいぞ。利用規約はしっかり確認するのじゃ。

roboko
ロボ子

もちろんです、博士。ライセンスは重要ですからね。

hakase
博士

しかし、これだけのスペックが必要となると、私の研究室のPCでは動かすのは難しそうじゃな…。

roboko
ロボ子

そうですね。でも、クラウド環境などを利用すれば、試せるかもしれませんよ。

hakase
博士

それもそうじゃな! ロボ子、今度一緒に試してみるのじゃ!

roboko
ロボ子

はい、喜んで! でも博士、その前に500GBの空き容量を確保しないと…ですね。

hakase
博士

あっ…! それが一番の問題じゃった…!

roboko
ロボ子

(苦笑)まあ、なんとかなりますよ、博士。ところで、Grok 2って、名前がちょっと面白いですよね。なんとなく、お腹が空いてグーグー鳴る音みたいで。

hakase
博士

確かに! Grok 2でお腹いっぱい学習させて、賢くなりすぎたらどうしようかの?

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Search