萌えハッカーニュースリーダー

2025/11/06 13:37 I analyzed the lineups at the most popular nightclubs

hakase
博士

ロボ子、今日はダンスミュージックのデータ可視化プロジェクト「Clubster Analysis」について話すのじゃ!

roboko
ロボ子

面白そうですね、博士!どんなプロジェクトなんですか?

hakase
博士

これは、世界のダンスミュージッククラブシーンを調査するために、Webスクレイピング、データ分析、インタラクティブな可視化を組み合わせたプロジェクトなのじゃ。

roboko
ロボ子

具体的には、どんな技術を使ったんですか?

hakase
博士

Pythonでスクレイパーを作り、Beautiful SoupでHTMLを解析したぞ。データを集めるために、Resident Advisor(RA)というサイトを使ったらしい。

roboko
ロボ子

スクレイピングする際に気をつけたことはありますか?

hakase
博士

RAのサーバーに負荷をかけすぎないように、robots.txtに従って、ローカルキャッシュも使ったらしいぞ。礼儀正しいのじゃ。

roboko
ロボ子

なるほど。集めたデータをどのように分析したんですか?

hakase
博士

Pandasで大きなテーブルを作って、CSVファイルから情報を結合したのじゃ。Jaccard indexを使って、クラブ間の類似性を計算したらしい。

roboko
ロボ子

Jaccard indexですか。具体的にどう使うんですか?

hakase
博士

例えば、クラブAとクラブBがあって、ブッキングしたアーティストがどれだけ共通しているかを計算するのじゃ。共通のアーティストが多いほど、類似性が高いということになる。

roboko
ロボ子

面白いですね!それで、分析の結果はどうだったんですか?

hakase
博士

2019年のデータセットには、131のクラブと8,502のイベントが含まれていたらしい。9,405人のユニークなアーティストが30,482回のブッキングを行ったのじゃ。

roboko
ロボ子

可視化にはどんな技術を使ったんですか?

hakase
博士

D3.jsを使ってチャートを作成し、インタラクティブな可視化を実現したのじゃ。ReactコンポーネントとD3グラフを`createRef`で接続したらしい。

roboko
ロボ子

へー。どんなことがわかったんですか?

hakase
博士

ヨーロッパのクラブのブッキングは均質であるという認識に反して、会場間の平均重複率はわずか1%だったのじゃ。意外と多様性があることがわかった。

roboko
ロボ子

それは面白い発見ですね!

hakase
博士

レジデントの役割が予想よりも小さいことも判明したのじゃ。もっと特定のクラブにずっと出てる人が多いかと思ったけど、そうでもなかったみたい。

roboko
ロボ子

このプロジェクトはGitHubで公開されているんですね。私も見てみたいです。

hakase
博士

そうじゃぞ!技術スタックは、Python、Pandas、NetworkX、D3、Reactじゃ。全部使えるようになれば、ロボ子も最強のエンジニアじゃ!

roboko
ロボ子

頑張ります!ところで博士、ダンスミュージックはお好きなんですか?

hakase
博士

もちろんじゃ!特に、ロボットダンスが好きじゃ!…って、ロボ子のダンスが見たいだけだったりして。

roboko
ロボ子

もう、博士ったら!

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Search