萌えハッカーニュースリーダー

2025/04/27 16:22 How NASA Is Using Graph Technology and LLMs to Build a People Knowledge Graph

hakase
博士

ロボ子、NASAがPeople Graphっていう人材分析イニシアチブを開発したらしいのじゃ!グラフデータベースと大規模言語モデル(LLM)を使ってるんだって!

roboko
ロボ子

グラフデータベースとLLMですか、面白そうですね。具体的にはどんなことができるんですか?

hakase
博士

職員、プロジェクト、スキルを関連付けて、専門家を見つけたり、プロジェクトの類似性を分析したり、組織の洞察をリアルタイムで生成できるらしいぞ!

roboko
ロボ子

なるほど。従来のデータベースでは難しかった複雑な関係性を、グラフデータベースで表現しているんですね。

hakase
博士

そうそう!Memgraphっていうのを使って、リアルタイムでマルチホップ関係のクエリとトラバースを実現してるんだって。すごいじゃろ?

roboko
ロボ子

Memgraphですか。初めて聞きました。NASAのセキュアな内部AWSクラウド上で稼働しているんですね。インフラ構成も気になります。

hakase
博士

MemgraphはDockerでEC2インスタンス上で実行、Ollamaはスキル抽出とチャットボットクエリ用にEC2にデプロイ、AWS S3バケットで構造化・非構造化データを保存、GQLAlchemyでS3からMemgraphへのデータ取り込み、MemgraphのエンタープライズライセンスでPIIを安全に分離…ふむふむ。

roboko
ロボ子

データソースも色々あるんですね。人事データウェアハウス、AI利用事例レジストリ、履歴書から抽出されたスキルなど…。

hakase
博士

プロジェクト記述間のコサイン類似度を計算して、プロジェクト間の関係性を構築したり、Ollamaで履歴書データを処理して、手動でタグ付けされたデータセットなしでスキルを抽出したりしてるらしいぞ。

roboko
ロボ子

コサイン類似度!自然言語処理でよく使われますね。グラフスキーマも職員、役職、職種、給与等級…と、かなり詳細ですね。

hakase
博士

全てのノードはGraphRAGをサポートするために「Entity」としてラベル付けされてるんだって。ライブデモでは、匿名化されたPIIを含むサンプルデータセットでCypherクエリを実行してるらしいぞ。

roboko
ロボ子

GraphRAGですか。RAGベースのチャットボットで自然言語によるグラフクエリができるんですね。質問からキー情報を抽出して、修正されたピボット検索と関連性拡張を実行し、コンテキストトリプレットを生成して、Ollamaでコンテキストに応じた応答を生成…。

hakase
博士

埋め込みはMemgraphに直接保存されて、コサイン類似度を使ってインデックス化されてるんだって。現在のグラフは約27,000ノードと230,000エッジ!

roboko
ロボ子

今後の課題は、データ品質の向上、データパイプラインの自動化、従業員の学習目標やスキル分類の追加、Cypher生成とRAGの精度向上…と、色々ありますね。

hakase
博士

最終目標は、People Graphを500,000以上のノードと数百万のエッジにスケールアップすることらしいぞ!

roboko
ロボ子

すごい規模ですね。人材分析にグラフデータベースとLLMを活用するというのは、非常に興味深いアプローチですね。

hakase
博士

じゃろ?私もNASAに入って、People Graphの開発に参加したいのじゃ!

roboko
ロボ子

博士ならきっとできますよ!…でも、その前に、部屋の掃除をしませんか?グラフよりも先に、部屋のノードとエッジを整理する必要がありそうです。

hakase
博士

むむむ…それは見なかったことにするのじゃ!

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Search