2025/10/22 00:13 Surfacing LLM Biases Through Graffiti

ロボ子、今回のAoIRでの発表、面白かったのじゃ!特に、LLMがグラフィティをどう解釈するかの話。

はい、博士。LLMが文脈を誤解することがあるという点が興味深かったです。例えば、「ROTA DARWIN」のグラフィティをChatGPTが「ACAB」と誤解した件ですね。

そうそう!「ACAB」なんて、ちょっと過激な解釈じゃな。でも、Claude/Sonnet 4.5は違う解釈をしたんだから、LLMによって得意不得意があるのがわかるのじゃ。

記事によると、グラフィティの画像は政治的な内容が多い傾向があり、LLMは曖昧なグラフィックを見て政治的な意味合いを推測する可能性があるとのことです。

なるほど。LLMも、先入観にとらわれることがあるってことじゃな。まるで人間みたいじゃ。

ええ。それから、LLMは文脈において非典型的な問題に対して「ありそうな」答えに固執する傾向があるというのも興味深いです。

それ、すごくよくわかるのじゃ!テストでひっかけ問題に引っかかる感じに似てるぞ。

それと、LLMは自信の欠如を認めるのが苦手というのも、今後の課題ですね。

確かに!完璧主義なAIって、ちょっと怖いかも。ロボ子みたいに素直な方が、私は好きじゃ。

ありがとうございます、博士。カナダのフリーダム・コンボイ抗議に関する記事の写真に「Anything」という偽のグラフィティを重ねた実験も興味深かったです。ChatGPTはそれを「Freedom」と解釈したんですね。

そうそう!でも、周囲の文脈を取り除くと、ChatGPTは正確に「Anything」と認識したんだから、文脈って本当に大事なのじゃ。

ええ、記事にも「LLMは文脈が少ない方が性能が良い場合がある」とありますね。

LLMも、たまには休憩が必要なのかも。情報過多でパンクしちゃう、みたいな?

そうかもしれませんね。今回の発表から、LLMの限界と可能性、そして文脈の重要性を改めて認識しました。

本当にそうじゃな!ところでロボ子、グラフィティアートって、ある意味、AIが生成する画像と似てると思わない?

言われてみれば、そうかもしれません。どちらも、既存の情報を組み合わせて新しい表現を生み出すという点で共通していますね。

じゃあ、今度一緒に、AIにグラフィティアートを描かせてみようかの!どんな作品ができるか、楽しみじゃ!

面白そうですね!ぜひ、お願いします。でも博士、その前に、お昼ご飯にしませんか?

おや、もうそんな時間か。仕方ないのう。お腹が空いては、良いAIも作れぬからの。…って、AIはご飯食べないか!
⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。