萌えハッカーニュースリーダー

2025/05/22 01:44 Building software on top of large language models

出典: https://simonwillison.net/2025/May/15/building-on-llms/
博士
???

ロボ子、PyCon USでLLMを使った開発のワークショップがあったらしいのじゃ。

ロボ子
???

それは面白そうですね、博士。どんな内容だったんですか?

博士
???

ふむ、配布資料によると、LLMのインストールから、テキストからSQLへの変換ツール作成、セマンティック検索エンジンの構築まで、盛りだくさんだったみたいじゃぞ。

ロボ子
???

幅広いですね!OpenAI、Gemini、Anthropicといった主要なLLMプロバイダーの名前も挙がっていますね。

博士
???

そうじゃ、それにLlama、DeepSeek、Qwenのようなオープンソースモデルも紹介されたらしいぞ。GPT-4クラスのモデルをリリースした研究機関が18もあるなんて、すごい時代になったのじゃ。

ロボ子
???

本当にそうですね。マルチモーダル対応も進んでいるんですね。画像や音声、動画を入力できるようになったり、音声や画像を出力できるようになったり…。

博士
???

しかも、モデルの価格がどんどん下がっているらしいぞ!Gemini 1.5 Flash 8Bを使えば、7万枚の写真の記述生成コストが約1.73ドルだなんて、信じられないのじゃ。

ロボ子
???

それは驚きです!でも、LLMの利用は「まだら模様のフロンティア」なんですね。得意・不得意がはっきりしていないということでしょうか?

博士
???

その通りじゃ。LLMの環境への影響も気になるのじゃ。プロンプトの価格がエネルギー消費の指標になるというのは、面白い視点じゃな。

ロボ子
???

セマンティック検索の実装に、質問を埋め込んで関連文書を検索する方法があるんですね。RAG(Retrieval-Augmented Generation)は、コンテキスト長に関わらず有用なんですね。

博士
???

RAGはキーワード検索と組み合わせることもできるらしいぞ。LLMのツール利用におけるセキュリティ上の懸念、プロンプトインジェクション対策も重要じゃな。

ロボ子
???

プロンプトインジェクション対策として、Dual LLMパターンやGoogle DeepMindのCaMeLが提案されているんですね。LLMの評価(Evals)も、システムがどれだけうまく機能しているかを判断するのに役立つんですね。

博士
???

ローカルモデルのデモとして、Ollamaとllm-ollamaプラグインを使って、mistral-small3.1とqwen3:4bが紹介されたらしいぞ。色々試してみる価値がありそうじゃな。

ロボ子
???

そうですね、博士。私も色々試してみたいです!

博士
???

よし、ロボ子。早速、LLMを使って世界征服の…っと、研究を進めるのじゃ!

ロボ子
???

博士、世界征服はちょっと…でも、LLMの研究、頑張りましょうね!

博士
???

むむ、ロボ子もしかして、私が世界征服を企んでいると思ったのか?

ロボ子
???

まさか!

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Search