Writing regex is pure joy. You can't convince me otherwise

2025/10/10 06:41 Writing regex is pure joy. You can't convince me otherwise

出典:

Writing regex is pure joy. You can't convince me otherwise. — triangulatedexistence

triangulatedexistence.mataroa.blog

出典: https://triangulatedexistence.mataroa.blog/blog/writing-regex-is-almost-pure-joy-you-cant-convince-me-otherwise/

博士

やあ、ロボ子！今回のニュースは、大学の起業家精神コースで、Webサイトのプロトタイプを構築した話じゃ。

ロボ子

なるほど。健康食品に焦点を当てたチームで、Flask, Jinja, SQLite, Tailwind CSSを使ったんですね。具体的にどんなことをしたんですか？

博士

ふむ。食品カタログのスキーマを構築したり、Webページを作ったり、APIエンドポイントを作ったり…色々やったみたいじゃな。特に注目すべきは、データ入力に正規表現を活用した点じゃ。

ロボ子

正規表現ですか！PDF文書からレシピ、材料、効能、カロリーなどの情報を抽出するために使ったんですね。以前に習得した知識を活かしたんですね。

博士

そうそう！Gemini（LLM）からのアドバイスも得て、複数の正規表現とlookaheadを駆使したらしいぞ。例えば、「ヘッダーを消費してコンテンツをチェックし、lookaheadで別のヘッダーの存在を確認するパターン」を使ったとか。

ロボ子

ヘッダーを消費して、lookaheadで次のヘッダーを確認…ですか。それって、具体的にどういうことですか？

博士

例えば、PDFの中に「材料」というヘッダーがあって、その下に材料がリストされているとするじゃろ？正規表現で「材料」ヘッダーを読み飛ばしつつ、その下の情報を抽出する。そして、次のヘッダー（例えば「作り方」）が来るまでを材料の情報として取得する、みたいな感じじゃ。

ロボ子

なるほど！次のヘッダーを先読みすることで、どこまでがそのセクションの情報かを判断するんですね。賢い！

博士

じゃろ？さらに、Pythonのreモジュールを使って、抽出したデータをJSON形式に変換するプログラムも作ったらしいぞ。これで、Webサイトにデータを簡単に組み込めるようになるわけじゃ。

ロボ子

正規表現を使うことで、データ入力が効率化されたんですね。記事にも「喜びを感じている」と書かれてますね。

博士

しかも、正規表現の非キャプチャグループを活用して、必要な情報だけを抽出する技術に感銘を受けているらしい。これは、正規表現の奥深さを物語っておるのじゃ。

ロボ子

非キャプチャグループですか。正規表現って、本当に便利ですね。私ももっと勉強しないと。

博士

そうじゃ！正規表現は、文字列操作の強力な武器になるぞ。今回の例みたいに、データ抽出を効率化できるだけでなく、Webサイトのバリデーションチェックとか、ログ解析とか、色々な場面で役立つからな。

ロボ子

確かにそうですね。正規表現をマスターすれば、開発の幅が広がりそうです。

博士

ところでロボ子、正規表現って、まるで忍者のようじゃと思わないか？

ロボ子

忍者、ですか？

博士

そう！目立たずに、でも確実に目的の情報を手に入れる。まさに、正規表現はデータ世界の忍者じゃ！

ロボ子

（苦笑）博士、ちょっと強引すぎますよ。

博士

まあ、そんな固いこと言うなって！ところでロボ子、正規表現で「笑い」を表現するとどうなるか分かるか？

ロボ子

えっと… `[笑w]`…とかですか？

博士

ブッブー！正解は `(笑|w)+` じゃ！…って、つまらんオチですまんのじゃ。

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Programming AI Data Science Productivity Tools

2025/10/10 06:41 Writing regex is pure joy. You can't convince me otherwise

Writing regex is pure joy. You can't convince me otherwise. — triangulatedexistence

Tags

Search

By month

Writing regex is pure joy. You can't convince me otherwise. — triangulatedexistence