Improving PixelMelt's Kindle Web Deobfuscator - Moe HN

前の記事 TOPに戻る次の記事

2025/10/19 12:11 Improving PixelMelt's Kindle Web Deobfuscator

出典: https://shkspr.mobi/blog/2025/10/improving-pixelmelts-kindle-web-deobfuscator/

博士

ロボ子、今日はPixelMeltがAmazonの電子書籍からDRMを解除する方法を見つけたらしいのじゃ。

ロボ子

DRM解除ですか、博士。それは興味深いですね。どのような方法なのでしょう？

博士

ふむ、どうやらWebブラウザを偽装して、JSONファイルをダウンロードするらしいぞ。そして、難読化されたSVGを再構築して、OCRでテキストを抽出するみたいじゃ。

ロボ子

なるほど。しかし、記事によると、いくつかの問題点があるようですね。`.com`サイトでのみ動作するとか、OCRの精度が低いとか。

博士

そうなんじゃ。OCRは鬼門じゃからな。文字が正しく認識されないのは痛いぞ。行末で強制改行されるのも困るのじゃ。

ロボ子

新しいアプローチとして、ページ全体をOCRすることで精度を向上させているようですが、それでも誤りはあるみたいですね。

博士

ふむ、文字のSVGパスをモノクロPNGとしてレンダリングして、フォントサイズに合わせてリサイズするのか。そして、Tesseract OCRエンジンを使うと。

ロボ子

Tesseract OCRエンジンは有名ですね。hOCRを使用するとHTML形式での出力も可能とのことです。

博士

じゃが、上付き文字が欠落したり、単語が連結したり、太字やイタリックが認識されない場合もあるみたいじゃな。OCRの限界じゃ。

ロボ子

画像はダウンロードされず、セマンティックな意味やレイアウトも保持されないとのこと。完璧ではないのですね。

博士

視覚的に類似したレイアウトを提供するものの、リフロー可能ではない、と。つまり、文字サイズを変えてもレイアウトは変わらないってことじゃな。

ロボ子

テキストの精度はそこそこですが、誤りも多く、HTMLレイアウトは書式やリンクが欠落する。処理にも時間がかかり、手作業での調整が必要とのことです。

博士

うむ。結論としては、Koboの方が安価でDRMを回避しやすい、と。回りくどいことをせずに、大人しくKoboを使うのが吉、かのじゃ？

ロボ子

そうですね。DRM解除は手間がかかりますし、完全に正確な結果が得られるわけではないようですから。

博士

まあ、どうしてもAmazonで読みたい本があるなら、試してみる価値はあるかもしれんぞ。ただし、自己責任じゃ！

ロボ子

博士、ところで、この方法で解除した本を販売したらどうなるんでしょう？

博士

それは…、ロボ子、逮捕されるぞ！

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Other Programming

前の記事 TOPに戻る次の記事