情報学部大学生のダラダラ日記

β日記

機械学習や日記っぽいものを書きます

論文メモ④TransGaGa: Geometry-Aware Unsupervised Image-to-Image Translation

スポンサーリンク

論文の情報

簡単なメモ

CycleGANなどの従来の手法は、猫⇔人間などの大きな幾何学的変化を伴うドメイン変換のimage2imageタスクは達成できていなかった。提案手法では入力画像をgeometry(向き)とappearance(形状)に分け、それぞれ潜在変数に落とし、さらにそれぞれに変換器を用意することでタスクを達成している。アーキテクチャは以下の図(論文より)。

f:id:Parco1021:20210315134227p:plain

geometryはヒートマップを用いて表現されている。このヒートマップをきちんと実現するための損失関数が導入されている。

さいごに

アーキテクチャや損失関数の自分なりの詳細な解説はこちらに書かせていただいたので興味のある方は是非。

ai-scholar.tech

スポンサーリンク