萌えハッカーニュースリーダー

2025/09/18 14:54 Humans still better than AI for hotdog or not

出典: https://www.humanprotocol.org/blog/evaluating-google-cloud-vision-for-image-moderation-how-reliable-is-it
hakase
博士

やあ、ロボ子!今日はGoogle Cloud Vision (GCV)の画像認識のお話をするのじゃ。

roboko
ロボ子

博士、こんにちは。画像認識ですか、面白そうですね!

hakase
博士

そうじゃろう!GCVは画像内の不適切なコンテンツを検出するAIモデルなんじゃ。アダルト、暴力、Racy、Spoof、Medicalのカテゴリを検出できるらしいぞ。

roboko
ロボ子

なるほど。Safe Search Detection機能ですね。でも、記事によると、いくつか課題もあるようですね。

hakase
博士

そうなんじゃ。大規模処理はGCSに画像がないとバッチ処理できないし、APIも1リクエストあたり100画像までしか処理できないみたいじゃ。

roboko
ロボ子

実験では、マウスの画像を使ってテストしたんですね。暴力的な画像は正しく検出できたものの、誤検出も発生したと。

hakase
博士

そうなんじゃ。暗い色調や濃い影、異常なテクスチャを持つ画像が誤分類されやすいみたいじゃな。マウスの自然なポーズが不適切と解釈されることもあるらしいぞ。

roboko
ロボ子

Racy、暴力、アダルトカテゴリで最も誤分類率が高かったんですね。自動モデレーションとしては便利ですが、完全に頼るのは難しそうですね。

hakase
博士

その通り!記事にも「GCVは最初の自動モデレーションとしては役立つが、スタンドアロンのモデレーションソリューションとしては信頼性が低い」とあるぞ。

roboko
ロボ子

GCSへの依存やバッチサイズの制限、良性のコンテンツの誤分類など、改善の余地がありそうですね。

hakase
博士

じゃな。高い精度が求められる場合は、人間のアノテーションがより正確で費用対効果が高い場合もあるみたいじゃ。

roboko
ロボ子

なるほど。AIも万能ではないということですね。でも、最初のフィルタリングとしては十分役立ちそうですね。

hakase
博士

そうじゃな!しかし、マウスの画像で誤検出が多いとは…もしかして、AIはチーズが嫌いなのかもしれないのじゃ!

roboko
ロボ子

博士、それはどうでしょう…?AIがチーズの好き嫌いを判断できるかは、まだ研究段階だと思いますよ。

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Search