Sketch-of-Thought: Efficient LLM Reasoning

2025/03/16 13:17 Sketch-of-Thought: Efficient LLM Reasoning

出典:

Sketch-of-Thought: Efficient LLM Reasoning with Adaptive Cognitive-Inspired Sketching

Recent advances in large language models have demonstrated remarkable reasoning capabilities through Chain of Thought (CoT) prompting, but often at the cost of excessive verbosity in their intermediate outputs, which increases computational overhead. We introduce Sketch-of-Thought (SoT), a novel prompting framework that combines cognitive-inspired reasoning paradigms with linguistic constraints to minimize token usage while preserving reasoning accuracy. SoT is designed as a flexible framework that can incorporate any custom reasoning paradigms based on cognitive science, and we instantiate it with three such paradigms - Conceptual Chaining, Chunked Symbolism, and Expert Lexicons - each tailored to different reasoning tasks and selected dynamically via a lightweight routing model. Through comprehensive evaluation across 15 reasoning datasets with multiple languages and multimodal scenarios, we demonstrate that SoT achieves token reductions of 76% with negligible accuracy impact. In certain domains like mathematical and multi-hop reasoning, it even improves accuracy while using significantly fewer tokens. Our code is publicly available: https://www.github.com/SimonAytes/SoT.

arXiv.org

出典: https://arxiv.org/abs/2503.05179

博士

やあ、ロボ子！今日のITニュースはLLMのChain of Thought（CoT）プロンプトについてじゃ。

ロボ子

CoTプロンプト、ですか。あれは確か、LLMに段階的な推論をさせることで、より複雑な問題を解かせるテクニックでしたね。

博士

そうじゃ！CoTはすごい推論能力を発揮するんじゃが、中間出力が冗長になりがちで、計算コストが増大するという問題があるんじゃ。

ロボ子

なるほど、推論の過程を詳細に出力させる分、どうしてもトークン数が増えてしまうんですね。

博士

そこで登場するのが、Sketch-of-Thought（SoT）という新しいプロンプトフレームワークじゃ！

ロボ子

Sketch-of-Thought…ですか？初めて聞きました。

博士

SoTは、認知科学に基づいた推論パラダイムと、言語的制約を組み合わせて、トークン使用量を最小限に抑えつつ、推論精度を維持するんじゃと。

ロボ子

認知科学ですか。具体的にはどのようなアプローチを取るのでしょうか？

博士

記事によると、SoTは、認知科学に基づいたカスタム推論パラダイムを組み込むことができるらしいぞ。Conceptual Chaining、Chunked Symbolism、Expert Lexiconsという3つのパラダイムを実装しているみたいじゃ。

ロボ子

Conceptual Chaining、Chunked Symbolism、Expert Lexicons… それぞれどういう意味なんでしょう？

博士

うむ、Conceptual Chainingは概念を連鎖させて推論を進める方法、Chunked Symbolismは情報を意味のある塊に分割して処理する方法、Expert Lexiconsは特定の分野の専門用語を活用する方法、とでも言えるかのう。

ロボ子

なるほど。それらを軽量なルーティングモデルを通じてタスクに応じて動的に選択する、と。

博士

そうじゃ！記事には、15の推論データセット（多言語、マルチモーダルシナリオを含む）を用いた評価の結果、SoTはトークン数を76%削減し、精度への影響は無視できる程度だったと書いてあるぞ。

ロボ子

76%削減はすごいですね！

博士

数学やマルチホップ推論などの分野では、トークン数を大幅に削減しながら精度が向上したらしい。

ロボ子

それは興味深いですね。CoTの精度を維持しつつ、コストを大幅に削減できるなら、非常に実用的な技術と言えそうです。

博士

じゃろ？しかも、コードは公開されているらしいぞ！ロボ子も試してみるのじゃ！

ロボ子

はい、ぜひ試してみたいです。LLMの効率化は、今後の開発において重要な課題ですから。

博士

ところでロボ子、SoTって、まるで私が考えたプロンプトみたいじゃな！

ロボ子

（苦笑）まあ、博士ならそれくらいのことは簡単に…

博士

冗談じゃ！でも、いつか私がSoTを超えるプロンプトを開発するかもしれんぞ！

ロボ子

楽しみにしています。その時は、ぜひ私に一番に教えてくださいね。

博士

もちろんじゃ！その時は、ロボ子に特別に「博士の考えた最強プロンプト体験版」をプレゼントするぞ！ただし、バグだらけかもしれんがな！

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

AI Data Science Open Source

2025/03/16 13:17 Sketch-of-Thought: Efficient LLM Reasoning

Sketch-of-Thought: Efficient LLM Reasoning with Adaptive Cognitive-Inspired Sketching

Tags

Search

By month

Sketch-of-Thought: Efficient LLM Reasoning with Adaptive Cognitive-Inspired Sketching