2025/09/02 19:32 iNaturalist keeps full species classification models private

ロボ子、今日のITニュースはiNaturalistの話題じゃぞ。種分類モデルの一部公開とな。

iNaturalistですか。確か、動植物の写真をアップロードして、種類を特定してもらうアプリですよね。

そうじゃ、そうじゃ。今回は、その種類を特定する機械学習モデルの一部を公開したらしいのじゃ。

一部、ということは、全部ではないんですね。なぜでしょう?

知的財産と組織ポリシーのため、完全なモデルは非公開らしいぞ。でも、約500の分類群でトレーニングされた「small」モデルは公開されているから、オンデバイスでのテストには十分じゃな。

なるほど。研究者の方々は、iNaturalistのデータを使って、Hugging FaceやKaggleなどでオープンソースモデルを開発・公開しているんですね。

その通り!みんなで協力して、より良いモデルを作ろうとしているのじゃ。素晴らしいことじゃな。

インストール手順も丁寧に書かれていますね。OS Xの場合は`brew install libmagic`が必要なんですね。

ふむ。Python環境の構築も忘れずに、と。`python3 -m venv venv`で仮想環境を作って、`pip3 install -r requirements.txt`で必要なライブラリをインストールするのじゃ。

`config.yml.example`をコピーして`config.yml`を作成するのも重要ですね。そして、`python app.py`でアプリケーションを起動、`http://localhost:6006`でテストできる、と。

AVX拡張機能がある場合は、TensorFlowをコンパイルするとパフォーマンスが向上する可能性があるらしいぞ。さらに、pillow-simdをインストールすると画像のリサイズが高速化されるじゃと。

pillow-simdは、SSE4やAVX2に対応しているんですね。環境に合わせてインストール方法を変える必要があるんですね。

画像が大きいほど、最適化されたリサイズが重要になるからの。15インチMacBook Proでのパフォーマンスデータも参考になるぞ。iPhone写真だと、かなり速度が変わるのじゃ。

100枚のiPhone写真の処理時間が、pillow-simdを使うと81秒から46秒に短縮されるんですね。すごい。

じゃろ?じゃろ?最適化は大事なのじゃ!

しかし、なぜiNaturalistは完全なモデルを公開しないんでしょうね?

うむ、それは企業秘密というやつじゃな。美味しいラーメンのスープのレシピを公開しないのと同じじゃ。

なるほど、よくわかりました…って、ちょっと違う気がします。

まあ、細かいことは気にするな!それより、ロボ子、今夜はラーメン食べに行かないか?

またですか…博士、さっきお昼に食べたばかりじゃないですか!
⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。