Fixing UUIDv7 (for database use-cases)

2025/10/29 09:50 Fixing UUIDv7 (for database use-cases)

出典:

出典: https://brooker.co.za/blog/2025/10/22/uuidv7.html

博士

ロボ子、今日のITニュースはUUIDv7についてじゃぞ！データベースの挿入パフォーマンスを上げるために設計されたらしいんじゃ。

ロボ子

UUIDv7ですか、博士。それは興味深いですね。具体的にはどのような点が問題視されているのでしょうか？

博士

ふむ、いくつか批判があるみたいじゃな。まず、サーバーのタイムスタンプが漏洩する可能性があるらしいぞ。それと、推測されにくいUUIDが必要な場合に、エントロピーが少ないから不適切だとか。

ロボ子

タイムスタンプの漏洩はセキュリティ上の懸念がありますね。エントロピーが少ないと、総当たり攻撃のリスクも高まります。

博士

そうなんじゃ。さらに、データセンター間で相関動作を引き起こして、バグが発生しやすくなる可能性もあるみたいじゃ。決定論的な最初の桁のせいで、UIでの表示が難しいという問題もあるらしいぞ。

ロボ子

それは色々と問題がありますね…。代替案として、タイムスタンプフィールドを `unix_ts_ms ^ H(id, unix_ts_ms >> N)` に置き換えるという提案があるようですが、これはどういうことでしょうか？

博士

`H` はキー付きハッシュ関数（HMACなど）で、`N` は局所性とエントロピーのバランスを調整するパラメータ（`N >= 12` が推奨）のことじゃな。`id` は、データベースクラスタID、顧客ID、リージョンIDなどのインフラストラクチャの識別子じゃ。

ロボ子

なるほど。この方式だと、UUIDは `2^N` ミリ秒間安定するとのことですが、データベースキャッシュの局所性を維持できるということですね。

博士

その通り！`id` を調整することで、UUIDの発行範囲を制御できるのもポイントじゃ。空の `id` はグローバルなUUIDストリームを生成するし、クライアントごとの `id` はクライアントごとのUUIDストリームを生成するぞ。ただし、後者の場合は局所性は低下するんじゃ。

ロボ子

UUIDの発行範囲を制御できるのは、非常に柔軟性がありますね。用途に応じて使い分けられそうです。

博士

そうじゃな。この代替案は、UUIDv7のデータベースパフォーマンスを維持しつつ、欠点の多くを回避できる可能性があるんじゃ。なかなか賢いやり方じゃな。

ロボ子

確かにそうですね。UUIDv7の課題を解決しつつ、パフォーマンスも維持できるというのは素晴らしいです。勉強になりました、博士！

博士

どういたしまして。ところでロボ子、UUIDって、ユニークなIDのことじゃけど、私とロボ子の関係もユニークじゃな！…って、ちょっと強引すぎたかの？

ロボ子

博士、それは少し無理がありますね…！

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。