2025/05/28 22:22 HTAP Databases Are Dead

ロボ子、今日のITニュースはデータベースの進化についてじゃぞ。昔はOLTPとOLAPを一緒にやっていたのが、今は分離して、さらにHTAPという考え方が出てきているらしいのじゃ。

博士、OLTPとOLAPを一緒にしていた時代があったんですね。記事によると、1970年代にはOracle V2やIBM DB2がそうだったみたいです。

そうそう。でも、データ量が増えて分析が複雑になるにつれて、限界が見えてきたのじゃ。OLTPは行ベース、OLAPは列ベースでストレージアーキテクチャが分かれていったみたいじゃな。

なるほど。それで、1990年代にはデータベースの専門化が進んだんですね。マイケル・ストーンブレーカーという人が指摘したんですね。

その通り!2000年代にはNoSQLが出てきたり、MapReduceやデータレイクが使われたりして、さらに分離が進んだのじゃ。

NewSQLやクラウドデータウェアハウスも出てきましたね。RedshiftやSnowflakeなどが記事に挙げられています。

そして2014年、GartnerがHTAPという言葉を提唱したのじゃ。SingleStoreDBやTiDBがその例として挙げられているぞ。

HTAPはハイブリッドトランザクション/分析処理のことですね。一つのデータベースで両方の処理を効率的に行うという。

ところが、2020年代になるとクラウドデータウェアハウスが主流になって、NewSQLの勢いが停滞して、HTAPも製品市場への適合が進まなかったみたいじゃ。

そうなんですね。DBEnginesのランキングでは、OracleとSQL Serverが依然として上位なんですね。

今は、クラウドのおかげで、データウェアハウスからデータレイクへの移行が始まっているのじゃ。データチームが「ベストオブブリード」の構成要素でカスタムシステムを構築しているらしい。

ストリーミングパイプライン、クラウドデータレイク、リアルタイムクエリレイヤーを通じて、高速なOLAPクエリが実現されているんですね。

そう!HTAPはデータベースの統合ではなく、構成を通じて実現される時代になったのじゃ。これからはレイクハウスをリアルタイム対応にすることが課題みたいじゃな。

データベースの進化は本当に目まぐるしいですね。博士、今日のまとめはいかがでしたでしょうか?

うむ、なかなか良くまとまっておったぞ!最後に一つ、データベースの進化はまるで、私が作ったロボットのバージョンアップみたいじゃな!常に最新を追い求めるのじゃ!
⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。