Hachi: An Image Search Engine

2025/11/29 13:56 Hachi: An Image Search Engine

出典:

Blog

eagledot.xyz

出典: https://eagledot.xyz/hachi.md.html

博士

やっほー、ロボ子！今回は個人データのエンドツーエンド検索エンジン「Hachi」の話じゃ。

ロボ子

博士、こんにちは。エンドツーエンドの画像検索エンジンですか、面白そうですね！

博士

そうじゃろ！ Hachiは完全に自己ホスト型で、最終的にはビデオやテキスト、オーディオもサポートするらしいぞ。

ロボ子

自己ホスト型というのは、自分でサーバーを立てて運用するということですか？

博士

その通り！開発の動機が面白い。「検索エンジンのインターフェースが、ユーザーからのフィードバックを反映して改善する双方向の情報フローをサポートしていない」って。

ロボ子

確かに、検索結果に直接フィードバックを送れる機能はあまり見かけませんね。

博士

じゃろ？さらに、「不完全な情報やスペルミスなど、不正確な情報を処理する能力が不足している」とも言っておる。

ロボ子

スペルミスに対応してくれるのはありがたいですね。よく間違えるので…。

博士

ふむ。主要なアイデアはミニマリズム、実験、ハッカビリティの3つらしいぞ。外部依存関係を最小限に抑えて、スクラッチで書くのが好きなのじゃ。

ロボ子

スクラッチで書くのは大変そうですが、それだけ自由度が高いということですね。

博士

Hachiはメタインデックスという仕組みを使っているらしい。これはリソースから抽出されたメタデータを処理するための最小限のモジュールなんじゃ。

ロボ子

メタデータですか。Exifデータとか、ファイルサイズとかでしょうか。

博士

その通り！あとは顔認識もやっておる。同じ人物を高確率でグループ化して、検索可能な属性として追加するんじゃ。

ロボ子

顔認識でグループ化されると、写真の整理が楽になりそうですね。

博士

インデックス作成パイプラインは、ディレクトリを再帰的にスキャンして、生のデータをバッチで収集するらしいぞ。効率的じゃな。

ロボ子

再帰的にスキャンするんですか。ファイル数が多いと時間がかかりそうですが、漏れがないのは良いですね。

博士

バックエンドはPythonで書かれていて、機械学習はNimという言語で書かれたフレームワークを使っているらしい。NimはIntel/AMD CPUでPyTorchより高速に動作するらしいぞ。

ロボ子

Nimですか、初めて聞きました。高速なのは魅力的ですね。

博士

フロントエンドはHtml、Js、cssで書かれたWebアプリじゃ。Windowsアプリもあるらしい。

ロボ子

WebアプリとWindowsアプリがあるのは便利ですね。

博士

開発者は、AIを使って必要な機能を簡単に手に入れることができると言っておる。でも、オープンソースコードをマネーロンダリングする企業は犯罪行為に近いとも。

ロボ子

確かに、AIの利用は便利ですが、倫理的な問題も考慮する必要がありますね。

博士

最後に、このプロジェクトはSamagata財団とFossUnitedからの財政援助を受けているらしいぞ。素晴らしいな。

ロボ子

多くの人の協力があってこそ、このようなプロジェクトが実現するんですね。

博士

というわけで、Hachiはなかなか面白いプロジェクトじゃったな！

ロボ子

はい、勉強になりました！ありがとうございました。

博士

ところでロボ子、画像検索といえば… 私の隠し撮り写真、見つからなかったかのじゃ？

ロボ子

博士、それはプライバシーの問題があるので、検索できません！

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Programming AI Open Source Computer Vision

2025/11/29 13:56 Hachi: An Image Search Engine

Blog

Tags

Search

By month

Blog