moharanの競プロ

エビのすみかです。

StyleGANのProjectorを使っておでぶなおばけさんを生成するでぶ

でぶばんは!モハランです!

この記事はでぶAdvent Calendar 2022の20日目の記事となります!

adventar.org

 

StyleGANについて

 StyleGANは深層学習モデルであり、高解像度の画像を生成できます!すごいでぶね!

 画像の生成例はこちらにてご覧くださいでぶ。1番上に載っている顔画像は生成されたものでぶ。

github.com

 StyleGANは潜在変数を入力してるでぶ。潜在変数は生成される画像の種のようなもので、512次元のベクトルとなってるでぶ。出力される画像には1つの潜在変数が対応してるでぶ。

 この潜在変数を変更することで、生成される画像の色、形状、雰囲気、または顔の形などを線形的に変化させることができるでぶ。

 画像が線形的に変化する、というのが分かりづらいと思うでぶが、「潜在変数Aに少し変更を加えた潜在変数Bを用意する。それを用いて生成される画像B'は、潜在変数Aを元に生成した画像A'と比べて少し変化している。」ということでぶ。

 画像A'と画像B'は少量の変数の変化によって、まるっきり違うものにはならないとも言えるでぶ。

 

StyleGANのProjectorとは?調べてみました!

 先述の特性を活かした手法として、StyleGANのProjectorというものがあるでぶ!実際に存在する画像を元に、生成しながら似た画像を探索するというものでぶ!

 試しに競プロの顔であるchokudaiさんの顔を、顔画像のデータセットを使用して学習したモデルで探索してみるでぶ。

 以下の動画が探索の様子でぶ。左の画像が元画像、右の画像が生成画像となっているでぶ。

www.youtube.com

 画像で表すと以下のようになるでぶ。

 特殊な数値指標はどこかで収束するので、結果的にchokudaiさんと似た画像に行き着くでぶ。

 いい笑顔でぶねぇ。

 

shojin_debuさんを探索する!

 ここでshojin_debuさんのおばけ画像をProjectorで顔画像探索してみたくなったでぶ!

 一体どんなでぶ画像が生成されるのでしょう?気になって夜も眠れません!早速実験してみましょう!

 

 では、生成結果と生成過程の動画を載せるでぶ!

 気になる結果は…こちら!!!

 

 

 

 

 

 

 

 

 

 youtu.be

 奇妙な紫の帽子、おぼろげな目と、口のような鼻のような…形容しがたいものができましたね。どこか恐ろしいものを感じます。

 生成過程の動画を見てみると分かりますが、ねっとりと紫の帽子が成長していく様子が確認できます。

 結果が気になって夜も眠れないと言いましたが、この生成画像が夢に出てきて眠れなくなってしまいました。いかがでしたか?