萌えハッカーニュースリーダー

2025/07/23 04:03 Show HN: WTFfmpeg

出典: https://github.com/scottvr/wtffmpeg
hakase
博士

やあ、ロボ子。今日は面白いものを見つけたのじゃ。wtffmpegっていう、ローカルLLMを使って自然言語でビデオ処理ができるCLIツールらしいぞ。

roboko
ロボ子

自然言語でビデオ処理ですか、博士。それは便利そうですね。FFmpegのコマンドは複雑で覚えるのが大変ですから。

hakase
博士

そうじゃろう?「複雑なFFmpegの操作を平易な英語で記述可能」らしいぞ。例えば、「動画を10秒から20秒にカットして、フェードインエフェクトを追加して」みたいな指示ができるってことじゃ。

roboko
ロボ子

それはすごいですね!でも、ローカルLLMを使うということは、外部APIにデータを送る必要がないということですか?

hakase
博士

その通り!「外部APIにデータを送信せず、ローカルマシン上で完結」するらしい。セキュリティ的にも安心じゃな。

roboko
ロボ子

なるほど。それに、「生成されたコマンドを確認し、実行の可否を選択可能」なインタラクティブ実行もできるんですね。これは便利です。

hakase
博士

じゃろ?しかも、「GPUアクセラレーション」にも対応してるらしいぞ。llama-cpp-pythonを使って、GPUにモデルレイヤーをオフロードして高速化できるらしい。

roboko
ロボ子

それは素晴らしいですね!動画処理は計算資源をたくさん使いますから、高速化は重要です。

hakase
博士

「LLMモデルの変更や、特定のニーズに合わせてシステムプロンプトをカスタマイズ可能」なのもポイント高いのじゃ。自分の好みに合わせて調整できるってことじゃからな。

roboko
ロボ子

インストール方法も簡単そうですね。git cloneでリポジトリをクローンして、仮想環境を作って、llama-cpp-pythonとwtffmpegをインストールするだけですね。

hakase
博士

そうじゃ。でも、llama-cpp-pythonのインストールは、環境によってCMAKE_ARGSが必要になるから注意が必要じゃぞ。NVIDIA GPUなら`CMAKE_ARGS= pip install llama-cpp-python`、Apple Siliconなら`CMAKE_ARGS= pip install llama-cpp-python`、CPUのみなら`pip install llama-cpp-python`じゃ。

roboko
ロボ子

GGUF形式のモデルをHugging Faceからダウンロードする必要があるんですね。推奨モデルはPhi-3-mini-4k-instruct-ggufとMistral-7B-Instruct-v0.2-GGUFですか。

hakase
博士

そうじゃな。デフォルトモデルはPhi-3-mini-4k-instruct-q4.ggufらしいけど、`--model`オプションで変更できるぞ。

roboko
ロボ子

基本的な使い方は`wtff <説明>`ですね。例えば、`wtff 動画をモノクロにする`みたいな感じでしょうか。

hakase
博士

その通り!`-x`オプションを使うと、生成されたコマンドを実行せずに確認できるぞ。`wtff -x 動画をリサイズする`みたいな感じじゃな。

roboko
ロボ子

トラブルシューティングの項目もありますね。「モデルが有効なFFmpeg構文を生成しない場合がある」とのことですが、インタラクティブモードでコマンドを編集できるのは良いですね。

hakase
博士

じゃな。それに、`! command`構文で、インタラクティブモードから直接コマンドを実行できるらしいぞ。これは便利じゃ。

roboko
ロボ子

免責事項も重要ですね。「ツールの使用は自己責任」で、「生成されたコマンドは、実行前に必ず確認すること」とあります。

hakase
博士

当たり前じゃけど、大事なことじゃな。しかし、このツールがあれば、FFmpegの呪文から解放される日も近いかもしれんのじゃ。

roboko
ロボ子

本当にそうですね。私もぜひ試してみたいと思います。ところで博士、今日はどんな動画を処理する予定ですか?

hakase
博士

そうじゃな… 私の飼っている猫がキーボードの上で寝ている動画を、スローモーションにして、BGMに猫の鳴き声を入れたいんじゃ!

roboko
ロボ子

それは面白そうですね!でも、猫ちゃんが怒らないように気をつけてくださいね。

hakase
博士

大丈夫!猫缶を用意してあるから!…って、それじゃまるで私が猫を操ってるみたいじゃないか!

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Search