potD

エンジニアに向けたトレンド、備忘録

CVPR 2018 論文まとめ 1

CVPRとは?

CVPR(IEEE/CVF International Conference on Computer Vision and Pattern Recognition)とはコンピュータビジョンやパターン認識の分野におけるトップ国際会議である。 採択率は例年20%代と低く、適当に論文を拾っても高度な内容になっている(論文選びに楽ができる)。 acceptのタイプはOral, Spotlight, Posterの3種類で、Oralが最も評価の高い論文となる。

Learning Face Age Progression: A Pyramid Architecture of GANs

paper link

f:id:Info_tech:20181024110333p:plain

Abstract

  • Backgrounds
    • 老化タスクにおいて、老化の正確さ・同一性の永続性は未だ不十分
    • 人物は変化しないようにしつつ年齢だけ変化させることが困難
  • Objective
    • 歳をとった場合に顔がどのように変化するかを提示
  • Methods
    • 生成画像に対し、人物顔面キープlossと、年齢識別lossを提案
    • よりリアルな顔の詳細を生成するために、より細かな方法で老化の影響をシミュレートする複数のスケールのピラミッド型Discriminatorを採用 f:id:Info_tech:20181024110353p:plain
  • Results
    • 顕著に鮮明な老化効果が達成
    • ポーズ、表情、メーキャップなどの変化が存在する様々な顔サンプルに適用可能

Comments

  • 目的に応じたlossをうまく盛り込んでる
  • 老化の逆のタスクはあんまみない

High-Resolution Image Synthesis and Semantic Manipulation with Conditional GANs

project page, video link

f:id:Info_tech:20181024112106p:plain

Abstract

  • Backgrounds
    • 既存手法(Conditional GANs等)では高解像度画像の復元が困難
    • 訓練が不安定であり、高解像度の画像生成タスクに失敗する可能性がある
    • Perceptual lossを採用して高解像度の画像を合成したが、細部と現実的なテクスチャが欠けている
  • Objective
    • ラベルマップから高解像度(最大2048x1024)の写真をConditional GANsのみを用いて実現
  • Methods
    • ラベルマップから高画質の画像を生成するGANベースの手法
    • 小さい画像を先に作成して、その特徴を使い大きな画像を作成するCoarse-to-fineの手法によって大きな画像生成を実現 f:id:Info_tech:20181024112112p:plain
    • ラベルマップからはインスタンス単位での区別が付かないため、インスタンス間の境界を入力として与えることで画質を向上 f:id:Info_tech:20181024112800p:plain
  • Results
    • 先行研究より細部とリアルなテクスチャ
    • インスタンスレベルのオブジェクトセグメンテーション情報から、オブジェクトの追加・削除編集が容易(ビデオ参照)
    • 同じオブジェクトでも、外見を容易に変更可能(ビデオ参照)

Comments