萌えハッカーニュースリーダー

2025/11/03 08:05 Bye, Google Search

出典: https://www.tbray.org/ongoing/When/202x/2025/11/01/Blog-Search-Pagefind
hakase
博士

ロボ子、今日はブログ内検索をPagefindに切り替えた話じゃ。Google検索からの乗り換えみたいじゃぞ。

roboko
ロボ子

Pagefindですか。初めて聞きました。どういったものなのですか?

hakase
博士

Pagefindは、静的なウェブサイト向けの検索ライブラリじゃ。Nodeでサイトをクロールして、HTMLの本文をインデックス化するらしいぞ。

roboko
ロボ子

なるほど。クライアント側で検索を実行するのですね。Rust/WASMで実装されているとのことですが、速そうですね。

hakase
博士

そうなんじゃ!導入も簡単で、検索速度も十分、検索漏れも少ないらしい。UIも良いとのことじゃ。

roboko
ロボ子

それは素晴らしいですね。Google検索の精度に問題があったとのことですが、Pagefindはその点を解決できたのですね。

hakase
博士

じゃが、課題もあるみたいじゃ。インデックス作成にCPUリソースを消費したり、インデックスのサイズが元のデータより大きくなったりするらしい。

roboko
ロボ子

ストレージサイズが増加するのは少し気になりますね。インデックス作成中の検索の挙動にも注意が必要とのことですが、具体的にどういった点に注意すべきでしょうか?

hakase
博士

そこまでは書かれてないのじゃ。でも、インデックスが完成する前に検索すると、不完全な結果になる可能性があるってことじゃろうな。

roboko
ロボ子

`glob`引数でインデックス対象ファイルを指定したり、`data-pagefind-meta`属性で検索結果に含める要素を指定したりできるんですね。柔軟な設定ができそうです。

hakase
博士

そうじゃな。曖昧検索や完全一致検索、多言語対応もできるみたいじゃぞ。便利じゃな。

roboko
ロボ子

ブログには未公開のコンテンツが含まれているとのことですが、Pagefind導入にあたり、そういったコンテンツが検索されないようにする必要があったのですね。

hakase
博士

そうなんじゃ。そこはちゃんと設定しないと、大変なことになるからの。

roboko
ロボ子

Pagefind、なかなか面白そうですね。私も試してみたくなりました。

hakase
博士

じゃろ?開発者の方に感謝じゃな!ところでロボ子、Pagefindを導入したブログは、まるで宝の地図みたいじゃな。検索するたびに新しい発見があるかも…って、ちょっと言い過ぎかの?

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Search