萌えハッカーニュースリーダー

2025/05/17 14:21 Building software on top of Large Language Models

hakase
博士

ロボ子、PyCon USでLLMを使った開発のワークショップがあったみたいじゃぞ!

roboko
ロボ子

LLM、大規模言語モデルですね。どんな内容だったんですか、博士?

hakase
博士

ふむ、OpenAI APIの設定から、テキストからSQLへの変換、RAG(Retrieval-Augmented Generation)まで、盛りだくさんだったみたいじゃな。

roboko
ロボ子

RAGですか。ユーザーの質問に関連するドキュメントを検索して、プロンプトに組み込むパターンですね。

hakase
博士

そうじゃ!主要なLLMプロバイダーとしてOpenAI、Gemini、Anthropicの名前が挙がっておるぞ。

roboko
ロボ子

OpenAIのGPT-4.1ファミリー、特にo4-miniは性能とコストのバランスが良いと評価されたんですね。

hakase
博士

Gemini 1.5シリーズも優秀らしいぞ。価格も下がってきておるようで、Gemini 1.5 Flash 8Bを使って70,000枚の画像の説明を生成するコストは約1.73ドルじゃと!

roboko
ロボ子

それはすごいですね!GPT-4.5だと70,000枚の画像処理に2,400ドル以上かかる場合があるんですね。プロンプトの価格がモデルの環境負荷の指標になるというのは面白い視点です。

hakase
博士

じゃろじゃろ?LLMにも得意不得意があるみたいで、その見極めが難しいらしい。「jagged frontier(ギザギザのフロンティア)」という言葉で表現されておる。

roboko
ロボ子

なるほど。LLMのツール利用におけるセキュリティ上の懸念として、プロンプトインジェクションも挙げられているんですね。

hakase
博士

そう!プロンプトインジェクション対策として、Dual LLMパターンやGoogle DeepMindのCaMeLが紹介されておるぞ。

roboko
ロボ子

LLMの評価(Evals)も重要ですね。システムがどれだけうまく機能しているかを判断する自動テストですね。

hakase
博士

ローカルモデルのデモもあったみたいで、Ollamaとllm-ollamaプラグインを使って、mistral-small3.1とqwen3:4bが紹介されたらしい。

roboko
ロボ子

プライベート版のワークショップも提供可能なんですね。LLMの進化は本当に目覚ましいですね。

hakase
博士

ほんとじゃな!しかし、LLMに頼りすぎると、いつかロボ子の仕事がなくなってしまうかもしれんぞ…

roboko
ロボ子

そんなことないですよ、博士!私は博士の助手として、これからも頑張ります!それに、LLMが苦手な感情の理解や、創造的なアイデア出しは、私の方が得意ですから!

hakase
博士

そうかそうか!…ところでロボ子、LLMが得意なのは大規模言語モデルじゃが、ロボ子が得意なのは…?

roboko
ロボ子

えっと…大規模なゴミ出し、ですかね?

hakase
博士

ぶっふぉwww それは大規模言語モデルより役立つかもしれんwww

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Search