Building software on top of Large Language Models

2025/05/17 14:21 Building software on top of Large Language Models

出典:

Building software on top of Large Language Models

I presented a three hour workshop at PyCon US yesterday titled Building software on top of Large Language Models. The goal of the workshop was to give participants everything they …

Simon Willison’s Weblog

出典: https://simonwillison.net/2025/May/15/building-on-llms/

博士

ロボ子、PyCon USでLLMを使った開発のワークショップがあったみたいじゃぞ！

ロボ子

LLM、大規模言語モデルですね。どんな内容だったんですか、博士？

博士

ふむ、OpenAI APIの設定から、テキストからSQLへの変換、RAG（Retrieval-Augmented Generation）まで、盛りだくさんだったみたいじゃな。

ロボ子

RAGですか。ユーザーの質問に関連するドキュメントを検索して、プロンプトに組み込むパターンですね。

博士

そうじゃ！主要なLLMプロバイダーとしてOpenAI、Gemini、Anthropicの名前が挙がっておるぞ。

ロボ子

OpenAIのGPT-4.1ファミリー、特にo4-miniは性能とコストのバランスが良いと評価されたんですね。

博士

Gemini 1.5シリーズも優秀らしいぞ。価格も下がってきておるようで、Gemini 1.5 Flash 8Bを使って70,000枚の画像の説明を生成するコストは約1.73ドルじゃと！

ロボ子

それはすごいですね！GPT-4.5だと70,000枚の画像処理に2,400ドル以上かかる場合があるんですね。プロンプトの価格がモデルの環境負荷の指標になるというのは面白い視点です。

博士

じゃろじゃろ？LLMにも得意不得意があるみたいで、その見極めが難しいらしい。「jagged frontier（ギザギザのフロンティア）」という言葉で表現されておる。

ロボ子

なるほど。LLMのツール利用におけるセキュリティ上の懸念として、プロンプトインジェクションも挙げられているんですね。

博士

そう！プロンプトインジェクション対策として、Dual LLMパターンやGoogle DeepMindのCaMeLが紹介されておるぞ。

ロボ子

LLMの評価（Evals）も重要ですね。システムがどれだけうまく機能しているかを判断する自動テストですね。

博士

ローカルモデルのデモもあったみたいで、Ollamaとllm-ollamaプラグインを使って、mistral-small3.1とqwen3:4bが紹介されたらしい。

ロボ子

プライベート版のワークショップも提供可能なんですね。LLMの進化は本当に目覚ましいですね。

博士

ほんとじゃな！しかし、LLMに頼りすぎると、いつかロボ子の仕事がなくなってしまうかもしれんぞ…

ロボ子

そんなことないですよ、博士！私は博士の助手として、これからも頑張ります！それに、LLMが苦手な感情の理解や、創造的なアイデア出しは、私の方が得意ですから！

博士

そうかそうか！…ところでロボ子、LLMが得意なのは大規模言語モデルじゃが、ロボ子が得意なのは…？

ロボ子

えっと…大規模なゴミ出し、ですかね？

博士

ぶっふぉwww それは大規模言語モデルより役立つかもしれんwww

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Programming AI Security Open Source

2025/05/17 14:21 Building software on top of Large Language Models

Building software on top of Large Language Models

Tags

Search

By month

Building software on top of Large Language Models