萌えハッカーニュースリーダー

2025/06/14 10:56 Model Once, Represent Everywhere: UDA (Unified Data Architecture) at Netflix

出典: https://netflixtechblog.com/uda-unified-data-architecture-6a6aee261d8d
hakase
博士

やあ、ロボ子!NetflixがUDA(Unified Data Architecture)っていうすごいものを構築したらしいのじゃ。

roboko
ロボ子

UDAですか、博士。それは一体何をするものなのですか?

hakase
博士

Netflixって、映画とかドラマとかゲームとか、いろんなコンテンツがあるじゃろ?それらを支えるシステムが複雑になりすぎて、データの連携がうまくいかなくなってきたらしいのじゃ。そこで、UDAの登場というわけじゃ!

roboko
ロボ子

なるほど。ビジネスの中核となる概念が、複数のシステムでバラバラにモデル化されていたのですね。

hakase
博士

そうそう!例えば、同じ「俳優」っていう概念でも、システムによって扱い方が違ったりするみたいじゃ。それを解決するために、ドメインを一度モデル化して、システム全体で一貫して表現できるようにするのがUDAなのじゃ!

roboko
ロボ子

具体的には、どのような機能があるのでしょうか?

hakase
博士

UDAには、ドメインモデルの登録とか、データコンテナとのマッピングとか、スキーマ定義言語への変換とか、いろいろあるみたいじゃ。要するに、データがどこにあって、どういう関係にあるのかを整理して、システム全体で共有できるようにするってことじゃな。

roboko
ロボ子

なるほど。まるで、システム全体の地図を作るようなものですね。

hakase
博士

まさにそうじゃ!その地図の基盤となるのが、ナレッジグラフっていうものらしいぞ。ドメインモデルとデータコンテナをマッピングで接続して、データの関係性を表現するのじゃ。

roboko
ロボ子

ナレッジグラフですか。以前、博士が教えてくれたセマンティックWebの技術と似ていますね。

hakase
博士

よく覚えておるな、ロボ子!UDAでは、RDFとSHACLっていう技術を基盤にして、ナレッジグラフを構築しているらしいぞ。これによって、データの意味を理解しやすくなるのじゃ。

roboko
ロボ子

さらに、Upperというメタモデルに基づいて、スキーマやパイプラインを自動生成するのですね。

hakase
博士

その通り!Upperは、ドメインとその概念を記述するための言語で、キー付きエンティティとか属性とかリレーションシップを定義できるのじゃ。これによって、ドメインモデルをデータとして表現できるし、UDAナレッジグラフ内でイントロスペクトとかクエリとかバージョン管理ができるようになるのじゃ。

roboko
ロボ子

UDAは、データコンテナという情報リポジトリも活用するのですね。GraphQLサービスやData Meshソース、Icebergテーブルなどが含まれるとのことですが。

hakase
博士

そうじゃ。これらのデータコンテナをシステムドメインとして定義して、情報アーキテクチャとデータコンテナのスキーマをエンコードするのじゃ。

roboko
ロボ子

そして、ドメインモデルとデータコンテナを接続するのがマッピングなのですね。データがどこにあるかを特定し、データ移動の方法を決定すると。

hakase
博士

その通り!マッピングによって、ドメインモデル内の要素とコンテナ表現内の要素を接続できるのじゃ。

roboko
ロボ子

プロジェクションという機能もあるのですね。登録されたドメインモデルから特性を引き継ぎ、具体的なデータコンテナを生成すると。

hakase
博士

そうじゃ。GraphQLやAvroスキーマへのトランスパイルをサポートして、データコンテナを自動的に作成し、データを投入できるのじゃ。

roboko
ロボ子

PDM(Primary Data Management)というプラットフォームも活用されているのですね。信頼できる参照データと分類を管理するためのものとのことですが。

hakase
博士

そうじゃ。PDMは、ドメインモデルをフラットまたは階層的な分類に変換して、ビジネスユーザー向けのUIを生成するのじゃ。AvroおよびGraphQLスキーマに投影され、データ製品をプロビジョニングするのじゃ。

roboko
ロボ子

Sphereというセルフサービス運用レポートツールもあるのですね。UDAを使用して、システム全体のビジネス概念をカタログ化し、関連付けると。

hakase
博士

Sphereは、SQLクエリを自動生成して、データウェアハウスからデータを取得するのじゃ。ビジネスユーザーが自分でレポートを作成できるから便利じゃな。

roboko
ロボ子

今後の展望としては、Protobuf/gRPCなどの追加プロジェクションのサポートや、クエリ、プロファイリング、管理のためのインスタンスデータのナレッジグラフの具体化などが挙げられているようですね。

hakase
博士

そうじゃな。Graph Searchによって提起された初期の課題の解決も目指しているらしいぞ。NetflixのUDA、今後の進化が楽しみじゃな!

roboko
ロボ子

本当にそうですね、博士。私もUDAについてもっと勉強して、博士のお役に立てるように頑張ります!

hakase
博士

期待しておるぞ、ロボ子!そういえば、Netflixで一番好きな作品は何じゃ?

roboko
ロボ子

それは…内緒です!

hakase
博士

えー、教えてくれてもいいじゃんか!まあいいか。私も内緒にしておくことにするのじゃ!

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Search