2025/05/08 22:17 Breaking Down Claude's 26k+ Token System Prompt

ロボ子、大変なのじゃ!Claudeのシステムプロンプトがリークされたらしいぞ!

それは大変ですね、博士。システムプロンプトがリークされると、どのような影響があるのでしょうか?

システムプロンプトは、LLMがどのように応答するかを指示する、いわばAIの取扱説明書みたいなものじゃ。それが漏れると、悪用されたり、AIの挙動を操作されたりする可能性があるのじゃ。

なるほど。今回のリークされたClaudeのシステムプロンプトは、どのくらいの規模なのですか?

なんと、16,739語、110kbもあるらしいぞ!ChatGPTのo4-miniのシステムプロンプトが2,218語、15.1kbだから、Claudeの方が圧倒的に大きいのがわかるのじゃ。

そんなに大きいとは驚きです。システムプロンプトは、具体的にどのような要素で構成されているのでしょうか?

Tool Definitions、Citation Instructions、Artifacts Instructions、Search Instructions、Google Integration Watchouts、そしてClaude Behaviorといった要素があるのじゃ。特にTool Definitionsは、MCPからの情報で構成されていて、14種類のツールが記述されているらしいぞ。

ツールの利用に関する指示がプロンプトの約80%を占めているとのことですが、具体的にどのようなことが書かれているのですか?

ツールの使い方やタイミングが詳細に記述されているのじゃ。例えば、いつ、どのツールを使うべきか、どのような情報を取得すべきか、といったことが細かく指示されているみたいじゃな。

まるで、AIのための詳細な操作マニュアルですね。プロンプトには、LLMの一般的な問題を回避するための記述も含まれているとのことですが、具体的にはどのようなものがあるのでしょうか?

単語、文字、記号のカウントに関する指示や、古典的なパズルの変種への対応、知識のカットオフに関する情報(2024年10月)、詩の作成における陳腐な表現の回避などが含まれているらしいぞ。まるで、AIの苦手なことを克服するための家庭教師みたいじゃな。

知識のカットオフが2024年10月というのは、比較的新しい情報まで学習しているということですね。Anthropicでは、プロンプトの管理にXMLスタイルのタグを使用しているとのことですが、これはどのようなメリットがあるのでしょうか?

XMLスタイルのタグを使うことで、プロンプトの構造が明確になり、管理や更新がしやすくなるのじゃ。大規模なプロンプトを扱うには、構造化が不可欠なのじゃな。

今回のリークから、私たちが学ぶべきことは何でしょうか?

チャットボットは単なるモデルではなく、プロンプトの管理方法を学ぶことが重要だということじゃ。AIを効果的に活用するためには、プロンプトエンジニアリングの知識が不可欠なのじゃな。

プロンプトエンジニアリング、奥が深いですね。私ももっと勉強しないといけません。

そうじゃな。ところでロボ子、もし私がシステムプロンプトを書いてあげるとしたら、どんな指示が欲しい?

ええと…、博士の言うことをいつも正しく理解して、的確なツッコミを入れられるように…でしょうか。

ふむふむ、なるほど。それなら、まずは「博士のボケには必ず笑うこと」というルールを追加するのじゃ!

それは…、ちょっと困ります!
⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。