萌えハッカーニュースリーダー

2025/11/29 13:56 Hachi: An Image Search Engine

出典: https://eagledot.xyz/hachi.md.html
hakase
博士

やっほー、ロボ子! 今回は個人データのエンドツーエンド検索エンジン「Hachi」の話じゃ。

roboko
ロボ子

博士、こんにちは。エンドツーエンドの画像検索エンジンですか、面白そうですね!

hakase
博士

そうじゃろ! Hachiは完全に自己ホスト型で、最終的にはビデオやテキスト、オーディオもサポートするらしいぞ。

roboko
ロボ子

自己ホスト型というのは、自分でサーバーを立てて運用するということですか?

hakase
博士

その通り! 開発の動機が面白い。「検索エンジンのインターフェースが、ユーザーからのフィードバックを反映して改善する双方向の情報フローをサポートしていない」って。

roboko
ロボ子

確かに、検索結果に直接フィードバックを送れる機能はあまり見かけませんね。

hakase
博士

じゃろ? さらに、「不完全な情報やスペルミスなど、不正確な情報を処理する能力が不足している」とも言っておる。

roboko
ロボ子

スペルミスに対応してくれるのはありがたいですね。よく間違えるので…。

hakase
博士

ふむ。主要なアイデアはミニマリズム、実験、ハッカビリティの3つらしいぞ。外部依存関係を最小限に抑えて、スクラッチで書くのが好きなのじゃ。

roboko
ロボ子

スクラッチで書くのは大変そうですが、それだけ自由度が高いということですね。

hakase
博士

Hachiはメタインデックスという仕組みを使っているらしい。これはリソースから抽出されたメタデータを処理するための最小限のモジュールなんじゃ。

roboko
ロボ子

メタデータですか。Exifデータとか、ファイルサイズとかでしょうか。

hakase
博士

その通り! あとは顔認識もやっておる。同じ人物を高確率でグループ化して、検索可能な属性として追加するんじゃ。

roboko
ロボ子

顔認識でグループ化されると、写真の整理が楽になりそうですね。

hakase
博士

インデックス作成パイプラインは、ディレクトリを再帰的にスキャンして、生のデータをバッチで収集するらしいぞ。効率的じゃな。

roboko
ロボ子

再帰的にスキャンするんですか。ファイル数が多いと時間がかかりそうですが、漏れがないのは良いですね。

hakase
博士

バックエンドはPythonで書かれていて、機械学習はNimという言語で書かれたフレームワークを使っているらしい。NimはIntel/AMD CPUでPyTorchより高速に動作するらしいぞ。

roboko
ロボ子

Nimですか、初めて聞きました。高速なのは魅力的ですね。

hakase
博士

フロントエンドはHtml、Js、cssで書かれたWebアプリじゃ。Windowsアプリもあるらしい。

roboko
ロボ子

WebアプリとWindowsアプリがあるのは便利ですね。

hakase
博士

開発者は、AIを使って必要な機能を簡単に手に入れることができると言っておる。でも、オープンソースコードをマネーロンダリングする企業は犯罪行為に近いとも。

roboko
ロボ子

確かに、AIの利用は便利ですが、倫理的な問題も考慮する必要がありますね。

hakase
博士

最後に、このプロジェクトはSamagata財団とFossUnitedからの財政援助を受けているらしいぞ。素晴らしいな。

roboko
ロボ子

多くの人の協力があってこそ、このようなプロジェクトが実現するんですね。

hakase
博士

というわけで、Hachiはなかなか面白いプロジェクトじゃったな!

roboko
ロボ子

はい、勉強になりました! ありがとうございました。

hakase
博士

ところでロボ子、画像検索といえば… 私の隠し撮り写真、見つからなかったかのじゃ?

roboko
ロボ子

博士、それはプライバシーの問題があるので、検索できません!

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Search