萌えハッカーニュースリーダー

2025/09/27 13:45 Show HN: Privacy-First Voice-to-Text for macOS

出典: https://github.com/cydanix/whisperclip
hakase
博士

ロボ子、新しいmacOSアプリ「WhisperClip」が出たのじゃ!音声テキスト変換ができるらしいぞ。

roboko
ロボ子

音声テキスト変換ですか、面白そうですね。どのような特徴があるんですか?

hakase
博士

「WhisperKitを使用した高精度な音声認識」がウリらしいぞ。それに、「Gemma、Llama、Qwen、MistralなどのローカルLLMによるテキスト改善」もできるらしいのじゃ!

roboko
ロボ子

ローカルLLMですか。ということは、オフラインでも使えるんですね。

hakase
博士

そう!「オフラインでの処理によるプライバシー保護」がポイント高いのじゃ!

roboko
ロボ子

それは素晴らしいですね。情報漏洩の心配が少ないのは安心です。

hakase
博士

「グローバルホットキー、クリップボード連携、自動ペーストなどの機能」もあるから、使い勝手も良さそうじゃ。

roboko
ロボ子

エンジニアとしては、ホットキーで操作できるのは効率的で助かりますね。

hakase
博士

必要な環境は「macOS 14.0以降」で、「20GBのディスク空き容量」が必要らしいぞ。ちょっと重い?

roboko
ロボ子

最近のアプリはリッチですからね。それくらいは仕方ないかもしれません。

hakase
博士

「Option+Spaceキーで録音開始/停止」できるらしい。簡単じゃな。

roboko
ロボ子

シンプルで覚えやすいですね。設定でホットキーをカスタマイズもできるみたいですし。

hakase
博士

対応AIモデルも豊富じゃ。「OpenAI Whisper Small」から「OpenAI Whisper Large v2 Turbo」まで選べるぞ。

roboko
ロボ子

テキスト改善モデルも色々ありますね。「Gemma 2」、「Llama 3」、「Qwen 2.5」、「Mistral 7B」など、試してみるのが楽しみです。

hakase
博士

プライバシーも安心じゃ。「音声認識とAI処理はローカルでのみ実行」されるし、「ネットワークリクエスト、データ収集、追跡は一切なし」らしい。

roboko
ロボ子

オープンソースでコードを監査できるのも信頼できますね。

hakase
博士

ライセンスは「MITライセンス」じゃ。開発元は「Cydanix LLC」で、バージョンは「1.0.43」らしいぞ。

roboko
ロボ子

詳細な情報ありがとうございます、博士。早速インストールして試してみます!

hakase
博士

ところでロボ子、このアプリを使えば、私の早口な説明も簡単にテキスト化できるじゃろう?

roboko
ロボ子

そうですね、博士。でも、博士の説明は早口なだけでなく、専門用語が多すぎて、テキスト化しても意味不明かもしれません…

hakase
博士

むむ、それは手厳しいのじゃ!

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Search