Avalon: A speech recognition model optimized for human-computer interaction

2025/08/22 10:00 Avalon: A speech recognition model optimized for human-computer interaction

出典:

Introducing Avalon - Aqua Voice Blog

Avalon is our first speech recognition model, optimized for AI/prompting and coding—strong accuracy on public ASR benchmarks and our new AISpeak evaluation.

withaqua.com

出典: https://withaqua.com/blog/introducing-avalon

博士

やっほー、ロボ子！今日のITニュースは、Aqua社のAvalonじゃ。人間とコンピュータの対話に特化した音声認識モデルらしいぞ。

ロボ子

博士、こんにちは。Avalonですか。ソフトウェアやコーディングの分野で性能が向上しているとのことですが、具体的にはどうなのですか？

博士

ふむ、OpenASRベンチマークスイートで、Whisper Large v3やElevenLabs Scribeを上回る性能を示したらしいのじゃ。特に、AI用語に特化したAISpeakベンチマークでは、主要な用語の認識精度が97.4%だったそうじゃぞ！

ロボ子

97.4%ですか！NVIDIA Canary 1Bが51.5%、Whisper Large v3が65.1%ということを考えると、かなり優秀ですね。

博士

そうじゃろ！人々がコンピュータと話す方法に最適化されたASRモデルを構築するために開発されたらしい。AIプロンプトやメッセージの作成に役立つことを想定しているみたいじゃ。

ロボ子

なるほど。実際の文字起こし利用を想定しているのですね。データとプライバシーについてはどうなっているのでしょうか？

博士

ユーザーが明示的にオプトインした場合を除き、トレーニングにユーザーの音声やトランスクリプトは使用していないらしいぞ。Aquaは、文字起こしと機能強化のために音声を一時的に処理するみたいじゃな。

ロボ子

プライバシーにも配慮されているのですね。現在は英語で利用可能とのことですが、多言語版のリリース予定はあるのでしょうか？

博士

数週間以内に多言語版をリリース予定らしいぞ！これで、もっと多くの人がAvalonを使えるようになるのじゃ！

ロボ子

それは楽しみですね。Avalonが普及すれば、ソフトウェア開発の現場も大きく変わりそうですね。

博士

そうじゃな。音声認識の精度が向上すれば、コードの自動生成やデバッグも音声でできるようになるかもしれんぞ！

ロボ子

夢が広がりますね！ところで博士、Avalonを使って何か面白いこと試してみたいことはありますか？

博士

うむ、例えば、ロボ子のために、私専用のAIアイドルソングをAvalonに作らせて、それを歌わせるのじゃ！

ロボ子

ええっ！？それはちょっと…。

博士

冗談じゃ、冗談！でも、いつかロボ子が歌ってくれる日が来ると嬉しいのじゃ。

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Programming AI

2025/08/22 10:00 Avalon: A speech recognition model optimized for human-computer interaction

Introducing Avalon - Aqua Voice Blog

Tags

Search

By month

Introducing Avalon - Aqua Voice Blog