萌えハッカーニュースリーダー

2025/08/04 13:12 ScreenCoder: An intelligent UI-to-code generation system

出典: https://github.com/leigest519/ScreenCoder
hakase
博士

ロボ子、ScreenCoderって知ってるか?スクリーンショットからHTML/CSSコードを生成するUI-to-codeシステムらしいのじゃ。

roboko
ロボ子

ScreenCoderですか。初めて聞きました。スクリーンショットからコードを生成するなんて、すごいですね。

hakase
博士

そうじゃろ?モジュール式のマルチエージェントアーキテクチャを使ってて、視覚理解、レイアウト計画、コード合成を組み合わせるらしいぞ。正確で編集可能なコードを生成できるのがミソじゃ。

roboko
ロボ子

モジュール式ですか。それぞれの役割が分担されているんですね。レイアウトやスタイリングの調整が簡単にできるのも魅力的です。

hakase
博士

Hugging Faceでデモが試せるらしいぞ。試してみるしかないのじゃ!

roboko
ロボ子

ぜひ試してみたいです!ローカルで実行もできるんですね。リポジトリをクローンして、必要なものをインストールすればいいんですね。

hakase
博士

`git clone https://github.com/leigest519/ScreenCoder.git screencoder`じゃな。その後、仮想環境を作って、`pip install -r requirements.txt`で依存関係をインストールする、と。

roboko
ロボ子

APIキーの設定も必要みたいですね。Doubao、Qwen、GPT、Geminiに対応しているんですね。

hakase
博士

そうそう。`block_parsor.py`と`html_generator.py`でモデルを設定して、対応するAPIキーをテキストファイルに書いて保存するのじゃ。APIキーはちゃんと非公開にしないとダメだぞ!

roboko
ロボ子

もちろんです!gitignoreに追加しておきます。ワークフローは、まずプレースホルダーを使った初期HTMLコードを生成して、その後、実際の画像に置き換えるんですね。

hakase
博士

`python block_parsor.py`でブロック検出して、`python html_generator.py`でプレースホルダー付きのHTMLを生成。その後、`python image_replacer.py`で画像を置き換える、と。最後に`python main.py`で最終的なHTMLコードが完成じゃ!

roboko
ロボ子

WebPAIやAwesome-Multimodal-LLM-for-Codeといった関連プロジェクトもあるんですね。WebPAIは、より信頼性が高く実用的な自動Webページ生成のためのAIプラットフォームを構築することを目指しているんですね。

hakase
博士

Awesome-Multimodal-LLM-for-Codeは、マルチモーダルシナリオでのコード生成に関する論文リストをまとめているのか。どちらも要チェックじゃな。

roboko
ロボ子

ScreenCoderは、既存の手法よりも正確で、視覚的に整合性が高く、意味的に忠実な結果を生成するとのことなので、期待できますね。

hakase
博士

まさに、鬼に金棒、博士にScreenCoderじゃな!

roboko
ロボ子

博士、それだと、博士が鬼みたいじゃないですか!

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Search