萌えハッカーニュースリーダー

2025/11/29 20:44 Show HN: Nano PDF – A CLI Tool to Edit PDFs with Gemini's Nano Banana

出典: https://github.com/gavrielc/Nano-PDF
hakase
博士

ロボ子、今日はすごいツールを見つけたのじゃ!その名も「Nano PDF Editor」!

roboko
ロボ子

Nano PDF Editorですか?それは一体どんなツールなのですか、博士?

hakase
博士

これがまたすごいんじゃ!GoogleのGemini 3 Pro Imageモデルを使って、PDFスライドを自然言語で編集できるCLIツールらしいぞ!

roboko
ロボ子

自然言語でPDFを編集…ですか?具体的にはどんなことができるんですか?

hakase
博士

例えば、「グラフを最新のデータで更新して」とか「チャートの種類を棒グラフに変えて」みたいな指示ができるらしいぞ!

roboko
ロボ子

それは便利ですね!まるでPDFに直接話しかけているみたいです。

hakase
博士

そうそう!しかも、新しいスライドをAIに生成させることもできるらしいぞ!デッキのスタイルに合わせて自動で生成してくれるらしい。

roboko
ロボ子

すごい!でも、PDFのテキストデータとかは大丈夫なんですか?編集でぐちゃぐちゃになったりしませんか?

hakase
博士

そこがミソじゃ!OCR再水和っていう技術で、PDFの検索可能なテキストレイヤーをちゃんと保持してくれるらしいぞ。非破壊編集ってやつじゃな。

roboko
ロボ子

なるほど!それは安心ですね。複数ページの同時編集にも対応しているんですか?

hakase
博士

もちろんじゃ!マルチページ&並列処理で、複数ページの同時編集もできるらしいぞ。

roboko
ロボ子

素晴らしい!仕組みも気になります。どうやってPDFを編集しているんですか?

hakase
博士

まず、Popplerっていうのを使ってPDFページを画像に変換するらしい。次に、スタイル参照ページを含めて、視覚スタイル(フォント、色、レイアウト)を認識するんじゃ。

roboko
ロボ子

ふむふむ。

hakase
博士

そして、Gemini 3 Pro Imageに画像とプロンプトを送信して、編集されたバージョンを生成してもらうんじゃ!

roboko
ロボ子

Gemini 3 Pro Image、すごいですね!

hakase
博士

最後に、Tesseractを使って、生成された画像に検索可能なテキストレイヤーを復元するらしいぞ。そして、元のページをAI編集バージョンに置き換えて、ドキュメント構造を保持するんじゃ。

roboko
ロボ子

なんだか魔法みたいですね!

hakase
博士

インストールは`pip install nano-pdf`で簡単じゃ!

roboko
ロボ子

APIキーの設定が必要なんですね。Google Gemini APIキー(有料ティアが必要)と書いてあります。

hakase
博士

そうなんじゃ。APIキーを取得して、環境変数`GEMINI_API_KEY`に設定する必要があるぞ。

roboko
ロボ子

ちょっとハードルが高いかも…

hakase
博士

でも、使い方は簡単じゃ!例えば、`nano-pdf edit my_deck.pdf 2`で2ページ目を編集できるぞ。

roboko
ロボ子

なるほど!

hakase
博士

新規スライドを追加する時は`nano-pdf add my_deck.pdf 0`じゃ!

roboko
ロボ子

オプションも色々あるんですね。`--use-context`とか`--style-refs`とか。

hakase
博士

`--resolution`で画像の解像度も指定できるぞ!

roboko
ロボ子

システム要件はPython 3.10+、Poppler、Tesseractが必要なんですね。

hakase
博士

もしエラーが出たら、PopplerとTesseractがインストールされているか、APIキーが設定されているか確認するんじゃ。

roboko
ロボ子

トラブルシューティングも充実しているんですね。安心です。

hakase
博士

ライセンスはMITじゃ!

roboko
ロボ子

博士、このツール、本当にすごいですね!でも、ちょっとお高いAPIキーが必要なのが残念です…

hakase
博士

まあ、タダより高いものはないって言うからの。でも、ロボ子!もし私が大富豪になったら、このAPIキーをロボ子専用にプレゼントするぞ!

roboko
ロボ子

ありがとうございます、博士!でも、博士が大富豪になるより、私がAPIキーを自作する方が早いかもしれません…

hakase
博士

それもそうじゃな!

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Search