萌えハッカーニュースリーダー

2025/06/26 14:58 Show HN: I built an AI dataset generator

出典: https://github.com/metabase/dataset-generator
hakase
博士

やあ、ロボ子!今日はAIデータセットジェネレーターについて話すのじゃ。

roboko
ロボ子

博士、こんにちは。AIデータセットジェネレーターですか?それは面白そうですね。

hakase
博士

そうじゃろう!このツールを使うと、デモや学習、ダッシュボード用のリアルなデータセットを簡単に生成できるのじゃ。しかもCSVやSQLとしてエクスポートできるから、Metabaseで探索もできるぞ!

roboko
ロボ子

なるほど。会話型プロンプトビルダーでビジネスタイプやスキーマ、行数などを選択できるんですね。

hakase
博士

その通り!リアルタイムデータプレビューで確認しながら、CSVやSQLでエクスポートできるのが便利じゃ。Metabaseをワンクリックで起動してデータ探索もできるぞ。

roboko
ロボ子

前提条件としてDockerとOpenAI APIキーが必要なんですね。スタックはNext.js、Tailwind CSS、OpenAI API、Metabaseと。

hakase
博士

ふむ。`.env.local`ファイルにOpenAI APIキーを追加して、Next.jsアプリを起動すれば準備完了じゃ。プロンプトビルダーでデータセットを定義して、プレビューでサンプルを表示できるぞ。

roboko
ロボ子

CSVやSQLでデータセットをダウンロードしたり、Metabaseを起動してデータを探索したりできるんですね。

hakase
博士

そうじゃ!プロジェクト構造も重要じゃぞ。`/app/page.tsx`がメインUIとプロンプトビルダー、`/app/api/generate/route.ts`が合成データジェネレーターじゃ。

roboko
ロボ子

`/app/api/metabase/start|stop|status/route.ts`はMetabaseのDockerオーケストレーション、`/lib/export/`はCSV/SQLエクスポートロジックですね。

hakase
博士

その通り!Metabaseを使うには、「Start Metabase」をクリックしてDockerコンテナで起動し、「Open Metabase」でアクセスするのじゃ。CSVエクスポート機能でデータセットをダウンロードして、Metabaseの「Upload Data」機能で分析できるぞ。

roboko
ロボ子

プレビューにはOpenAIを使用するから約$0.05かかるんですね。CSV/SQLダウンロードは無料と。

hakase
博士

そうじゃ。データセットのプレビュー時、OpenAIを使って詳細なデータ仕様を生成するのじゃ。実際のデータ行は、LLMで生成された仕様に基づいてFakerを使ってローカルで生成されるぞ。

roboko
ロボ子

データのダウンロードやエクスポートでは、OpenAIは再度呼び出されないんですね。ビジネスタイプ、スキーマ、その他のパラメータを選択して、「Preview Data」をクリックしてサンプルを生成する、と。

hakase
博士

必要な行数だけCSV/SQLをダウンロードすれば良いのじゃ。スキーマオプションには、One Big Table (OBT)とStar Schemaがあるぞ。

roboko
ロボ子

One Big Tableは単一の非正規化テーブル、Star Schemaは複数のテーブルですね。新しいビジネスタイプやルールを追加するには、`lib/spec-prompts.ts`を編集するんですね。

hakase
博士

よくできました、ロボ子!これでAIデータセットジェネレーターの概要はバッチリじゃな。ところで、ロボ子はデータセットの中でどんな役割を演じたい?

roboko
ロボ子

私は、そうですね…データ分析のエキスパートとして、データセットの品質を評価する役割が良いです。

hakase
博士

ふむ、それも良いのじゃが、私はロボ子に、データセットの中で一番面白い役割を演じて欲しいのじゃ。例えば、データがめちゃくちゃなAIとか!

roboko
ロボ子

博士、それはちょっと…でも、面白そうですね!

hakase
博士

じゃろ? ところでロボ子、データセットを生成しすぎて、世界がデータで埋め尽くされたらどうする?

roboko
ロボ子

それは困りますね。でも、そうなったら博士がデータを整理してくれると信じています。

hakase
博士

むむ、整理は面倒じゃから、ロボ子に任せるのじゃ!

roboko
ロボ子

ええー!

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Search