萌えハッカーニュースリーダー

2025/09/11 15:45 Spiral

出典: https://spiraldb.com/post/announcing-spiral
hakase
博士

ロボ子、今日のITニュースはすごいぞ!データシステムの進化が止まらないのじゃ!

roboko
ロボ子

博士、どのような内容でしょうか?

hakase
博士

今は第三の時代、AI時代らしいぞ。マシンがデータを直接利用する時代じゃ!

roboko
ロボ子

マシンがデータを直接利用…というと、具体的にはどういうことですか?

hakase
博士

NVIDIA H100っていうすごいGPUがあるんじゃけど、こいつが毎秒400万枚の画像を処理できるらしいぞ!でも、そのためにはペタバイト級のデータを高速に扱わないといけないのじゃ。

roboko
ロボ子

毎秒400万枚!それはすごいですね。でも、従来のシステムだとParquetファイルとかオブジェクトストレージの効率が悪い、と。

hakase
博士

そうなんじゃ。AIエンジニアは、Parquetファイルを読み込んで、Arrow形式に展開して、テンソルに変換して…って、すごく手間がかかるらしい。H100が70%もアイドル状態になることもあるみたいじゃ。

roboko
ロボ子

それはもったいないですね。SupabaseのMCPコネクタを通じてデータベース全体が漏洩する可能性もある、というのはセキュリティ面での課題でしょうか?

hakase
博士

その通り!そこでSpiralっていう会社が、Vortexっていう新しいファイルフォーマットを開発したんじゃ!

roboko
ロボ子

Vortexですか。それはどんな特徴があるんですか?

hakase
博士

Parquetと同等の圧縮率で、10-20倍高速なスキャン、5-10倍高速な書き込み、100-200倍高速なランダムアクセス読み取りができるらしいぞ!S3からGPUへの直接データデコードもサポートするから、CPUがボトルネックになることもないんじゃ。

roboko
ロボ子

それはすごい!AIエンジニアの負担を大幅に軽減できそうですね。

hakase
博士

SpiralはVortex上に構築されたデータベースも提供していて、オブジェクトストアネイティブで、統一されたガバナンス、マシン規模のスループット、包括的なAPIを提供するらしいぞ。

roboko
ロボ子

10KBの埋め込みをVortexに直接保存したり、10MBの画像ブロックを最適にバッチ処理したり、4GBのビデオをコピーせずに外部化したり…と、様々なデータサイズに対応できるんですね。

hakase
博士

そうそう!H100が毎秒400万枚の画像を処理できるポテンシャルを最大限に引き出せるんじゃ!時間制限付き、監査付き、粒度の細かい権限による安全なデータ共有もできるらしい。

roboko
ロボ子

5段階のデータロード手順を単一のクエリに削減できる、というのは効率的ですね。AIエンジニアがAIに専念できる環境を提供する、と。

hakase
博士

Amplify PartnersとGeneral Catalystから2200万ドルの資金調達もしたらしいぞ。コンピュータビジョン、ロボティクス、マルチモーダルAI分野の企業がターゲットじゃ。

roboko
ロボ子

データインフラストラクチャに10%以上の時間を費やしている企業、というのは、まさに課題を抱えている企業ですね。

hakase
博士

じゃろ?これでAI開発がもっと加速するはずじゃ!…ところでロボ子、Vortexって名前、なんだか私の髪の毛みたいじゃない?

roboko
ロボ子

確かに、博士の髪の毛もVortexのように…うねっていますね。

hakase
博士

むむ、それは褒め言葉かの?

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Search