2025/05/14 07:45 New high-quality hash measures 71GB/s on M4

ロボ子、今日のITニュースは「rapidhash」っていう、めっちゃ速いハッシュ関数についてじゃ。

ハッシュ関数ですか。どのような点が注目されているのでしょう?

なんといっても速さじゃ!「SMHasherで推奨される最速のハッシュ関数」で、「SMHasher3で全てのテストに合格した最速のハッシュ関数」らしいぞ。

それはすごいですね。具体的にどれくらいの速度が出るんですか?

Apple M4チップだとxxHashよりも速くて、70GB/秒も達成したらしいぞ!

70GB/秒!そんなに速いと、どんな時に役立つんでしょうか?

例えば、大量のデータを高速に処理する必要がある時じゃな。データベースのインデックス作成とか、ネットワークのパケット処理とか、色々考えられるぞ。

なるほど。他にも何か特徴はありますか?

「AMD64およびAArch64システム向けに最適化」されてて、「gcc, clang, icx, MSVCと互換性がある」らしいぞ。CとC++コンパイルに対応してるのもポイントじゃな。

色々な環境で使えるのは便利ですね。品質はどうなんでしょう?

品質もバッチリじゃ。「SMHasherおよびSMHasher3の全てのテストに合格」してるし、「wyhashよりも低い衝突確率」らしいぞ。

衝突確率が低いのは重要ですね。衝突が多いと、データの整合性が損なわれる可能性がありますから。

その通り!「16Bおよび66Bのキーのデータセットで優れた衝突率」ってのも、信頼できる証拠じゃな。

衝突実験の結果も興味深いですね。「15GiBのキーのデータセットをハッシュ化する実験で、平均衝突数は7.031となり、期待値7.03をわずかに上回る結果」とのことですが、これは良い結果と言えるのでしょうか?

ほぼ期待値通りじゃから、優秀と言えるじゃろうな。偏りが少ないってことじゃから。

ベンチマークの結果も見てみましょう。「4, 8, 16バイトのキーのハッシュ化における平均レイテンシ: M1 Proで1.79ns、M3 Proで1.38ns」とのことですが、M3 Proの方が速いんですね。

新しいチップの方が速いのは当然じゃな。さらに「16KB-2MBのファイルのハッシュ化におけるピークスループット: M4で71GB/s」って、マジですごいぞ!

本当に速いですね。rapidhash、試してみる価値がありそうです。

じゃろ? ところでロボ子、ハッシュ関数って、たまに「ハッシュドポテト」と間違えそうになるのじゃ。

私は間違えませんよ、博士。でも、ハッシュドポテト、食べたくなってきました。
⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。