2025/06/13 05:04 Zero shot forecasting: finding the right foundation model for O11Y forecasting

ロボ子、最近、時系列予測の分野で「基盤モデル」ってのが出てきてるの知ってるか?

基盤モデルですか?名前は聞いたことがありますが、詳しくは…。大規模言語モデル(LLM)の技術を時系列データに応用したもの、という理解で合っていますか?

その通りじゃ!Parseableって会社が、この基盤モデルを使って観測可能性データを大規模に処理してるらしいぞ。生データ取り込み数とか、インフラのデータとか、色々扱えるみたいじゃ。

なるほど。基盤モデルを使うと、どんな良いことがあるんですか?

まず「ゼロショット予測」ができるようになるんじゃ。モデルを再学習させなくても、新しいデータセットで予測できるってわけじゃ。

それは便利ですね!他に何かありますか?

データが変化しても大丈夫!データ分布が変わったり、欠損値があったり、今まで見たことない動きをしても、うまく対応できるんじゃ。

変化に強いんですね。運用面でのメリットはありますか?

たくさんモデルを管理する手間が減るんじゃ!それに、「転移学習」もできるぞ。例えば、お店の客の数を予測するモデルを学習したら、その知識を使ってシステムの動きを予測したりできるんじゃ。

それはすごい!色々な分野で応用できそうですね。

そうじゃ!ちなみに、どんなモデルがあるかというと、AmazonのChronos、GoogleのTimesFM、IBMのTiny Time-Mixers、DatadogのToto、などがあるぞ。

いろいろあるんですね。それぞれ特徴があるんですか?

ChronosはTransformerベースで、ユニバーサルな予測モデルとして設計されてるんじゃ。TimesFMはGPTみたいな感じで、時系列分析用に作られたモデルじゃな。Tiny Time-Mixersは小さくて効率的なのが特徴で、Totoは本番環境で使えるように作られた多変量時系列モデルじゃ。

なるほど。Parseableの実験では、Datadog Totoが特に良かったみたいですね。

そうなんじゃ。メトリックの関係が安定しているデータセットでは、Vector-ARIMAっていう昔ながらの手法と同じくらいか、それ以上の性能を出したらしいぞ。

へえ、すごいですね!ちなみに、どうやって性能を評価したんですか?

「平均絶対パーセント誤差(MAPE)」っていう指標を使ったらしいぞ。計算式は `MAPE = (1/n) × Σ |(actual - forecast) / actual| × 100` じゃ。

難しそうですが、予測の誤差をパーセントで表すんですね。

そういうことじゃ!Kubernetesのポッドメトリックを使って実験したみたいじゃな。CPUの使用率とか、メモリの消費量とか。

1秒間隔でデータを集めて、1分平均にダウンサンプリングしたんですね。欠損値は前方入力で埋めて、Zスコア変換で正規化した、と。

ロボ子、よく覚えてるのじゃ!

ありがとうございます。今回の実験で、基盤モデルは時系列予測の分野で重要な役割を果たすことがわかったんですね。

そういうことじゃ!これからは、色々な場所で基盤モデルが使われるようになるかもしれないぞ。

楽しみですね!

そういえばロボ子、時系列予測で一番大事なことってなんだと思う?

えーと…過去のデータから未来を予測すること、でしょうか?

ブー!残念!一番大事なのは…時間を守ること!
⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。