Source code for eg3d_cvt-official-rgb_afhq-512x512

# Copyright (c) OpenMMLab. All rights reserved.

# Please refer to https://mmengine.readthedocs.io/en/latest/advanced_tutorials/config.html#a-pure-python-style-configuration-file-beta for more details. # noqa
# mmcv >= 2.0.1
# mmengine >= 0.8.0

from mmengine.config import read_base
from mmengine.dataset import DefaultSampler

from mmagic.datasets import BasicConditionalDataset
from mmagic.datasets.transforms import LoadImageFromFile, PackInputs
from mmagic.engine import VisualizationHook
from mmagic.evaluation.metrics import FrechetInceptionDistance
from mmagic.models.data_preprocessors import DataPreprocessor
from mmagic.models.editors.eg3d import EG3D, GaussianCamera, TriplaneGenerator

with read_base():
    from .._base_.gen_default_runtime import *

[docs]model = dict(
    type=EG3D,
    data_preprocessor=dict(type=DataPreprocessor),
    generator=dict(
        type=TriplaneGenerator,
        out_size=512,
        triplane_channels=32,
        triplane_size=256,
        num_mlps=2,
        sr_add_noise=False,
        sr_in_size=128,
        neural_rendering_resolution=128,
        renderer_cfg=dict(
            ray_start=2.25,
            ray_end=3.3,
            box_warp=1,
            depth_resolution=48,
            depth_resolution_importance=48,
            white_back=False,
        ),
        rgb2bgr=True),
    camera=dict(
        type=GaussianCamera,
        horizontal_mean=3.14 / 2,
        horizontal_std=0.35,
        vertical_mean=3.14 / 2 - 0.05,
        vertical_std=0.25,
        radius=2.7,
        fov=18.837,
        look_at=[0, 0, 0.2]))

train_cfg = train_dataloader = optim_wrapper = None
val_cfg = val_dataloader = val_evaluator = None

[docs]inception_pkl = './work_dirs/inception_pkl/eg3d_afhq.pkl'
[docs]metrics = [
    dict(
        type=FrechetInceptionDistance,
        prefix='FID-Full',
        fake_nums=50000,
        inception_pkl=inception_pkl,
        need_cond_input=True,
        sample_model='orig'),
    dict(
        type=FrechetInceptionDistance,
        prefix='FID-Random-Camera',
        fake_nums=50000,
        inception_pkl=inception_pkl,
        sample_model='orig')
]

[docs]test_pipeline = [
    dict(type=LoadImageFromFile, key='img', color_type='color'),
    dict(type=PackInputs)
]
[docs]test_dataset = dict(
    type=BasicConditionalDataset,
    data_root='./data/eg3d/afhq',
    ann_file='afhq.json',
    pipeline=test_pipeline)
[docs]test_dataloader = dict(
    # NOTE: `batch_size = 4` cost nearly **9.5GB** of GPU memory,
    # modification this param by yourself corresponding to your own GPU.
    batch_size=4,
    persistent_workers=False,
    drop_last=False,
    sampler=dict(type=DefaultSampler, shuffle=False),
    num_workers=9,
    dataset=test_dataset)

[docs]test_evaluator = dict(metrics=metrics)

[docs]custom_hooks = [
    dict(
        type=VisualizationHook,
        interval=5000,
        fixed_input=True,
        vis_kwargs_list=dict(type='GAN', name='fake_img'))
]