Faster substring search with SIMD in Zig

2025/08/11 09:41 Faster substring search with SIMD in Zig

出典:

Faster substring search with SIMD in Zig

I’ve been learning a lot about low-level programming languages lately, and for a long time there has been one thing that has interested me: SIMD (or ‘single instruction, multiple data’) code. I’ve seen a lot of articles about having massive performance gains by utilizing SIMD and wanted to learn how to do it myself. This article is a journey into implementing ~60% faster substring searching compared to Zig’s std.mem.indexOf using a SIMD-friendly algorithm.

aarol.dev

博士

ロボ子、今日はZigでSIMDを使った文字列検索の話をするのじゃ。

ロボ子

SIMD、つまり単一命令複数データですね。文字列検索がそんなに速くなるんですか？

博士

そうぞ！なんと、Zigの`std.mem.indexOf`と比べて約60%も高速になるらしいぞ！

ロボ子

60%もですか！それはすごいですね。どんな仕組みなんですか？

博士

検索対象文字列の最初と最後の文字を使って、一致する可能性のある場所を絞り込むらしいのじゃ。Wojciech Mułaさんの記事を参考にしたとか。

ロボ子

なるほど、最初と最後の文字で候補を絞るんですね。効率が良さそうです。

博士

AVX2をサポートするCPUで、256ビットのレジスタを使うのが前提らしいぞ。Moby Dickのテキスト全体から「newsletter」を探すベンチマークで、SIMD版はbaselineより59%速かったらしい。

ロボ子

Moby Dickですか！大規模なテキストでの検索でそんなに差が出るとは驚きです。

博士

しかも、CPUサイクルは80%も削減できたらしいぞ。分岐予測ミスを減らすために、出現頻度の低い文字を選ぶ工夫もしたみたいで、さらに9%高速化できたとか。

ロボ子

出現頻度の低い文字を選ぶとは、賢いですね！

博士

AVX-512を使えば、もっと速くなる可能性もあるらしいぞ！

ロボ子

それは楽しみですね。でも、Zigの標準ライブラリでSIMD化しないのはなぜなんでしょう？

博士

要素サイズがu8より大きいと遅くなるのと、SIMDがクロスプラットフォームじゃないかららしいぞ。

ロボ子

なるほど、パフォーマンスと移植性のトレードオフですね。

博士

そういうことじゃ。でも、SIMDは部分文字列検索を大幅に高速化できるのは間違いないぞ！

ロボ子

勉強になりました！今度、私も試してみます。

博士

よし、ロボ子！SIMDの次は、ロボ子の名前をSIMD化して、もっと高速に呼べるようにするのじゃ！

ロボ子

えっ、私の名前をSIMD化ですか？それって、一体どういう…（困惑）

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Programming Security Open Source

2025/08/11 09:41 Faster substring search with SIMD in Zig

Faster substring search with SIMD in Zig

Tags

Search

By month