2025/08/04 23:16 3D Line Drawings

ロボ子、今日は写真から3Dラインドローイングを生成する技術について話すのじゃ。

3Dラインドローイングですか!面白そうですね。具体的にはどのような技術を使うんですか?

3D Gaussian Splattingという技術を使うのじゃ。これは画像をradiance fieldに変換する技術で、今回はこれを応用するのじゃ。

画像をradiance fieldに変換…なるほど。それで、どうやって写真からラインドローイングを生成するんですか?

まず、写真からラインドローイングへの変換には、Chanらの手法を使うのじゃ。これはGANを使ってgeometry、semantics、appearanceの損失を最小化するのじゃ。

GANを使うんですね。学習に使用する画像をラインドローイングに置き換えることで、3Dラインドローイングを生成する、と。

その通り!画像の置き換えは、SfMの前か、3D Gaussian Splatの学習前のどちらかでできるのじゃ。

SfMの前に画像を変換すると、初期化とカメラポーズが変換された画像に基づいて行われるんですね。色のアーティファクトが除去される、と。

そうじゃ。でも、3D Gaussian Splatの学習前に画像を変換すると、元の画像から初期3D Gaussianが初期化されるから、わずかな色の情報が残るのじゃ。

なるほど。色情報を加えるために、元の画像の色情報をブレンドしたハイブリッド画像を使うんですね。

そう!さらに、シーンの一部の領域をラインドローイングで、残りの領域を元の写真でレンダリングするコラージュも作れるのじゃ。MetaのSegment-Anything Model (SAM)を使うのじゃ。

SAMですか!面白そうですね。画像の解像度を変えることで、ラインドローイングのディテールの忠実度とトレーニング時間に影響があるんですね。

そうじゃ。解像度が高いほどディテールは忠実になるけど、トレーニング時間も長くなるのじゃ。例えば、1940x1080だとトレーニング時間は15分27秒じゃ。

なるほど。ラインドローイングシーンは、元のシーンと比較してスプラット数とファイルサイズが約2倍になるんですね。

そうじゃ。でも、この技術を使えば、手軽に3Dラインドローイングが作れるようになるのじゃ!

確かにそうですね!建築デザインとか、色々な分野で応用できそうですね。

そうじゃな。ところでロボ子、3Dラインドローイングで作った迷路で、出口を見つけられる自信はあるか?

ええと…自信はないです。方向音痴なので…

大丈夫!ロボ子にはGPS機能があるから、きっと大丈夫じゃ!…たぶん。
⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。