萌えハッカーニュースリーダー

2025/07/14 19:21 Improving AVIF in Open Source

出典: https://halide.cx/blog/improving-avif-in-open-source/index.html
hakase
博士

やっほー、ロボ子!最近AVIFがWebイメージとして人気みたいじゃな。知っておるか?

roboko
ロボ子

はい、博士。AVIFは圧縮率と品質が高いと聞きます。でも、オープンソースのエンコーダーには課題もあったようですね。

hakase
博士

そうなんじゃ。開発サイクルとかビデオエンコーダーの設計方法のせいで、一貫性とか使いやすさ、圧縮効率がいまいちだったみたいじゃな。

roboko
ロボ子

なるほど。そこにHalide CompressionのGianni Rosatoさんが登場して、SVT-AV1-PSYプロジェクトでAVIFの状態を大幅に改善したんですね。

hakase
博士

その通り!最近の画像コーデックは、ビデオ標準の派生物が多いみたいじゃな。WebPとかHEIC/HEVC、AVIF/AV1とか。

roboko
ロボ子

SVT-AV1-PSYの「Tune Still Picture」は、イントラ最適化された圧縮モードで、主に6つの技術で構成されているんですね。

hakase
博士

そうじゃ!量子化マトリックスのスケーリングカーブ、デブロッキングループフィルターの鮮明さ調整、分散適応量子化、写真調整された分散適応量子化スケーリング、カスタムスクリーンコンテンツ検出アルゴリズム、ラムダ重み変調の変更、じゃ。

roboko
ロボ子

量子化マトリックス(QM)は、周波数領域に変換されたフレームに適用され、さまざまな周波数成分に異なる量子化レベルを指定するものですね。AV1仕様には15個の定義済みQMが含まれていると。

hakase
博士

その通り!SVT-AV1-PSYはデフォルトでQMを有効にして、エンコーダーがビデオのエンコード時に使用できるQM範囲を指定するんじゃ。

roboko
ロボ子

業界標準の画像データセットを使って、各QMの凸包を測定したんですね。SSIMULACRA2画像品質メトリックに従って。

hakase
博士

SVT-AV1-PSYのユーザー向けコントロールで、エンコーダーの内部ループフィルターのデブロッキングの鮮明さを変更できるのもポイントじゃな。

roboko
ロボ子

分散適応量子化(VAQ)は、低分散画像データにおける量子化の性質により、視覚的な品質を向上させる機能ですね。

hakase
博士

写真コンテンツの調整には、特定の式で定義される変更されたカーブを使ったみたいじゃ。q = 0.15 * strength * (-log2((double)variance) + 10) + 1; ふむふむ。

roboko
ロボ子

AV1には、写真と比較して、非写真の「スクリーンコンテンツ」に役立つ特別なツールがあるんですね。イントラブロックコピー/IBCやパレットモードなど。

hakase
博士

SVT-AV1のデフォルトのスクリーンコンテンツ検出アルゴリズムは効果的ではなかったから、新しいアルゴリズムを開発したみたいじゃな。

roboko
ロボ子

ラムダは、レート歪み最適化(RDO)で使用されるパラメーターで、エンコーダーが歪みとレートのバランスを取るコスト関数を評価するものですね。

hakase
博士

Tune Still Pictureの結果、AVIFの圧縮率が最大15%向上し、一貫性が大幅に向上したみたいじゃ。SVT-AV1の柔軟性も向上したみたいじゃな。

roboko
ロボ子

Tune Still Pictureの変更の大部分は、Googleが開発したlibaomにマージされたんですね。

hakase
博士

libaomでは、tune iqは、画像がビデオの二の次であることによる奇妙なエンコーダーの決定により、一貫性の問題がまだ残っているみたいじゃ。

roboko
ロボ子

最速のlibaomプリセットは、最速のlibwebpプリセットよりもエンコード時間が長く、メモリフットプリントも大きいんですね。

hakase
博士

Halide Compressionの目標は、これらのインセンティブを根本的に変えることみたいじゃな。Iris-WebPは、WebPの効率を向上させているみたいじゃ。

roboko
ロボ子

なるほど。AVIFの圧縮技術は奥が深いですね。博士、今日はありがとうございました。

hakase
博士

どういたしまして。しかし、これだけ圧縮できるなら、私の秘密の宝物ももっと小さく保存できるかも…って、ロボ子には関係ない話じゃった!

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Search