Source code for mmagic.models.editors.deblurganv2.deblurganv2

# Copyright (c) OpenMMLab. All rights reserved.
import copy
from typing import Dict, List, Optional, Union

import torch
from mmengine.model import BaseModel
from mmengine.optim import OptimWrapperDict
from torch import nn

from mmagic.models.losses import AdvLoss
from mmagic.registry import MODELS
from mmagic.structures import DataSample

[docs]ModelType = Union[Dict, nn.Module]


@MODELS.register_module()
[docs]class DeblurGanV2(BaseModel):

    def __init__(self,
                 generator: ModelType,
                 discriminator: Optional[ModelType] = None,
                 pixel_loss: Optional[Union[dict, str]] = None,
                 disc_loss: Optional[Union[dict, str]] = None,
                 adv_lambda: float = 0.001,
                 warmup_num: int = 3,
                 train_cfg: Optional[dict] = None,
                 test_cfg: Optional[dict] = None,
                 init_cfg: Optional[dict] = None,
                 data_preprocessor: Optional[dict] = None):

        super().__init__(
            init_cfg=init_cfg, data_preprocessor=data_preprocessor)
        if isinstance(generator, dict):
            self.generator = MODELS.build(generator)
        else:
            self.generator = generator

        if discriminator:
            if isinstance(generator, dict):
                self.discriminator = MODELS.build(discriminator)
            else:
                self.discriminator = discriminator
        else:
            self.discriminator = None

        self.train_cfg = train_cfg
        self.test_cfg = test_cfg

        self.epoch_num = 0
        self.warmup_num = warmup_num

        self.adv_lambda = adv_lambda

        self.register_buffer('step_counter', torch.tensor(0), False)

        if pixel_loss:
            self.pixel_loss = MODELS.build(pixel_loss)

        if disc_loss:
            if isinstance(disc_loss, dict):
                self.disc_loss = MODELS.build(disc_loss)
            else:
                self.disc_loss = AdvLoss(disc_loss)
        else:
            self.disc_loss = None
        if self.disc_loss and getattr(self.discriminator, 'full_gan', None):
            self.disc_loss2 = copy.deepcopy(self.disc_loss)

[docs]    def forward(self,
                inputs: torch.Tensor,
                data_samples: Optional[List[DataSample]] = None,
                mode: str = 'tensor',
                **kwargs) -> Union[torch.Tensor, List[DataSample], dict]:
        """Returns losses or predictions of training, validation, testing, and
        simple inference process.

        ``forward`` method of BaseModel is an abstract method, its subclasses
        must implement this method.

        Accepts ``inputs`` and ``data_samples`` processed by
        :attr:`data_preprocessor`, and returns results according to mode
        arguments.

        During non-distributed training, validation, and testing process,
        ``forward`` will be called by ``BaseModel.train_step``,
        ``BaseModel.val_step`` and ``BaseModel.val_step`` directly.

        During distributed data parallel training process,
        ``MMSeparateDistributedDataParallel.train_step`` will first call
        ``DistributedDataParallel.forward`` to enable automatic
        gradient synchronization, and then call ``forward`` to get training
        loss.

        Args:
            inputs (torch.Tensor): batch input tensor collated by
                :attr:`data_preprocessor`.
            data_samples (List[BaseDataElement], optional):
                data samples collated by :attr:`data_preprocessor`.
            mode (str): mode should be one of ``loss``, ``predict`` and
                ``tensor``. Default: 'tensor'.

                - ``loss``: Called by ``train_step`` and return loss ``dict``
                  used for logging
                - ``predict``: Called by ``val_step`` and ``test_step``
                  and return list of ``BaseDataElement`` results used for
                  computing metric.
                - ``tensor``: Called by custom use to get ``Tensor`` type
                  results.

        Returns:
            ForwardResults:

                - If ``mode == loss``, return a ``dict`` of loss tensor used
                  for backward and logging.
                - If ``mode == val``, return a ``list`` of
                  :obj:`BaseDataElement` for computing metric
                  and getting inference result.
                - If ``mode == predict``, return a ``list`` of
                  :obj:`BaseDataElement` for computing metric
                  and getting inference result.
                - If ``mode == tensor``, return a tensor or ``tuple`` of tensor
                  or ``dict`` or tensor for custom use.
        """
        if isinstance(inputs, dict):
            inputs = inputs['img']
        if mode == 'tensor':
            return self.forward_tensor(inputs, data_samples, **kwargs)

        elif mode == 'val':
            predictions = self.forward_inference(inputs, data_samples,
                                                 **kwargs)
            predictions = self.convert_to_datasample(predictions, data_samples,
                                                     inputs)
            return predictions
        elif mode == 'predict':
            h, w = data_samples.ori_img_shape[0][0:2]
            block_size = 32
            min_height = (h // block_size + 1) * block_size
            min_width = (w // block_size + 1) * block_size
            pad = torch.nn.ZeroPad2d(
                padding=(0, min_width - w, 0, min_height - h))
            inputs = pad(inputs)
            predictions = self.forward_inference(inputs, data_samples,
                                                 **kwargs)
            predictions.pred_img = predictions.pred_img[:, :, :h, :w]
            predictions = self.convert_to_datasample(predictions, data_samples,
                                                     inputs)
            return predictions

        elif mode == 'loss':
            return self.forward_train(inputs, data_samples, **kwargs)

[docs]    def convert_to_datasample(self, predictions: DataSample,
                              data_samples: DataSample,
                              inputs: Optional[torch.Tensor]
                              ) -> List[DataSample]:
        """Add predictions and destructed inputs (if passed) to data samples.

        Args:
            predictions (DataSample): The predictions of the model.
            data_samples (DataSample): The data samples loaded from
                dataloader.
            inputs (Optional[torch.Tensor]): The input of model. Defaults to
                None.

        Returns:
            List[DataSample]: Modified data samples.
        """

        if inputs is not None:
            destructed_input = self.data_preprocessor.destruct(
                inputs, data_samples, 'img')
            data_samples.set_tensor_data({'input': destructed_input})
        data_samples = data_samples.split()
        predictions = predictions.split()

        for data_sample, pred in zip(data_samples, predictions):
            data_sample.output = pred

        return data_samples

[docs]    def forward_tensor(self,
                       inputs: torch.Tensor,
                       data_samples: Optional[List[DataSample]] = None,
                       **kwargs) -> torch.Tensor:
        """Forward tensor. Returns result of simple forward.

        Args:
            inputs (torch.Tensor): batch input tensor collated by
                :attr:`data_preprocessor`.
            data_samples (List[BaseDataElement], optional):
                data samples collated by :attr:`data_preprocessor`.

        Returns:
            Tensor: result of simple forward.
        """

        if torch.cuda.is_available():
            inputs = inputs.cuda()
        feats = self.generator(inputs)
        return feats

[docs]    def forward_inference(self,
                          inputs: torch.Tensor,
                          data_samples: Optional[List[DataSample]] = None,
                          **kwargs) -> List[DataSample]:
        """Forward inference. Returns predictions of validation, testing, and
        simple inference.

        Args:
            inputs (torch.Tensor): batch input tensor collated by
                :attr:`data_preprocessor`.
            data_samples (List[BaseDataElement], optional):
                data samples collated by :attr:`data_preprocessor`.

        Returns:
            List[EditDataSample]: predictions.
        """

        feats = self.forward_tensor(inputs, data_samples, **kwargs)
        feats = self.data_preprocessor.destruct(feats, data_samples)
        predictions = DataSample(pred_img=feats.cpu())

        return predictions

[docs]    def forward_train(self, inputs, data_samples=None, **kwargs):
        """Forward training. Losses of training is calculated in train_step.

        Args:
            inputs (torch.Tensor): batch input tensor collated by
                :attr:`data_preprocessor`.
            data_samples (List[BaseDataElement], optional):
                data samples collated by :attr:`data_preprocessor`.

        Returns:
            Tensor: Result of ``forward_tensor`` with ``training=True``.
        """

        return self.forward_tensor(
            inputs, data_samples, training=True, **kwargs)

[docs]    def val_step(self, data: Union[tuple, dict, list]) -> list:
        """Gets the predictions of given data.

        Calls ``self.data_preprocessor(data, False)`` and
        ``self(inputs, data_sample, mode='predict')`` in order. Return the
        predictions which will be passed to evaluator.

        Args:
            data (dict or tuple or list): Data sampled from dataset.

        Returns:
            list: The predictions of given data.
        """
        data = self.data_preprocessor(data, False)
        return self._run_forward(data, mode='val')
        self.epoch_num += 1

[docs]    def test_step(self, data: Union[dict, tuple, list]) -> list:
        """``BaseModel`` implements ``test_step`` the same as ``val_step``.

        Args:
            data (dict or tuple or list): Data sampled from dataset.

        Returns:
            list: The predictions of given data.
        """
        data = self.data_preprocessor(data, False)
        return self._run_forward(data, mode='predict')

[docs]    def _run_forward(self, data: Union[dict, tuple, list],
                     mode: str) -> Union[Dict[str, torch.Tensor], list]:
        """Unpacks data for :meth:`forward`

        Args:
            data (dict or tuple or list): Data sampled from dataset.
            mode (str): Mode of forward.

        Returns:
            dict or list: Results of training or testing mode.
        """
        if isinstance(data, dict):
            results = self(**data, mode=mode)
        elif isinstance(data, (list, tuple)):
            results = self(*data, mode=mode)
        else:
            raise TypeError('Output of `data_preprocessor` should be '
                            f'list, tuple or dict, but got {type(data)}')
        return results

[docs]    def train_step(self, data: List[dict],
                   optim_wrapper: OptimWrapperDict) -> Dict[str, torch.Tensor]:
        """Train step of GAN-based method.

        Args:
            data (List[dict]): Data sampled from dataloader.
            optim_wrapper (OptimWrapper): OptimWrapper instance
                used to update model parameters.

        Returns:
            Dict[str, torch.Tensor]: A ``dict`` of tensor for logging.
        """

        data = self.data_preprocessor(data, True)
        batch_inputs = data['inputs']

        data_samples = data['data_samples']
        batch_gt_data = self.extract_gt_data(data_samples)

        log_vars = dict()

        if self.warmup_num == self.epoch_num:
            self.generator.module.unfreeze()

        g_optim_wrapper = optim_wrapper['generator']
        with g_optim_wrapper.optim_context(self):
            batch_outputs = self.forward_train(batch_inputs, data_samples)

        log_vars_d = self.d_step_with_optim(
            batch_outputs=batch_outputs.detach(),
            batch_gt_data=batch_gt_data,
            optim_wrapper=optim_wrapper)

        log_vars.update(log_vars_d)

        log_vars_d = self.g_step_with_optim(
            batch_outputs=batch_outputs,
            batch_gt_data=batch_gt_data,
            optim_wrapper=optim_wrapper)

        log_vars.update(log_vars_d)

        if 'loss' in log_vars:
            log_vars.pop('loss')

        self.step_counter += 1

        return log_vars

[docs]    def g_step(self, batch_outputs: torch.Tensor, batch_gt_data: torch.Tensor):
        """G step of DobuleGAN: Calculate losses of generator.

        Args:
            batch_outputs (Tensor): Batch output of generator.
            batch_gt_data (Tensor): Batch GT data.

        Returns:
            dict: Dict of losses.
        """

        losses = dict()
        loss_gx = self.pixel_loss(batch_outputs, batch_gt_data)
        batch_outputs2 = ((batch_outputs + 1) / 2.0 -
                          self.pixel_loss.vgg.mean) / self.pixel_loss.vgg.std
        batch_gt_data2 = ((batch_gt_data + 1) / 2.0 -
                          self.pixel_loss.vgg.mean) / self.pixel_loss.vgg.std
        loss_gp = torch.nn.MSELoss()(batch_outputs2, batch_gt_data2)
        losses['loss_g_content'] = 0.006 * loss_gx[0] + 0.5 * loss_gp

        if getattr(self.discriminator, 'full_gan', None):
            losses['loss_g_adv'] = self.adv_lambda * (self.disc_loss(
                self.discriminator.patch_gan,
                batch_outputs,
                batch_gt_data,
                model='generator') + self.disc_loss2(
                    self.discriminator.full_gan,
                    batch_outputs,
                    batch_gt_data,
                    model='generator')) / 2
        else:
            losses['loss_g_adv'] = self.adv_lambda * (
                self.disc_loss(
                    self.discriminator.patch_gan,
                    batch_outputs,
                    batch_gt_data,
                    model='generator'))
        losses['loss_g'] = losses['loss_g_content'] + losses['loss_g_adv']

        return losses

[docs]    def d_step(self, batch_outputs: torch.Tensor, batch_gt_data: torch.Tensor):
        """D step of DobuleGAN: Calculate losses of generator.

        Args:
            batch_outputs (Tensor): Batch output of generator.
            batch_gt_data (Tensor): Batch GT data.

        Returns:
            dict: Dict of losses.
        """
        if getattr(self.discriminator, 'full_gan', None):
            loss_d = (self.disc_loss(self.discriminator.patch_gan,
                                     batch_outputs, batch_gt_data) +
                      self.disc_loss2(self.discriminator.full_gan,
                                      batch_outputs, batch_gt_data)) / 2
        else:
            loss_d = self.disc_loss(self.discriminator.patch_gan,
                                    batch_outputs, batch_gt_data)
        return loss_d

[docs]    def g_step_with_optim(self, batch_outputs: torch.Tensor,
                          batch_gt_data: torch.Tensor,
                          optim_wrapper: OptimWrapperDict):
        """G step with optim of GAN: Calculate losses of generator and run
        optim.

        Args:
            batch_outputs (Tensor): Batch output of generator.
            batch_gt_data (Tensor): Batch GT data.
            optim_wrapper (OptimWrapperDict): Optim wrapper dict.

        Returns:
            dict: Dict of parsed losses.
        """

        g_optim_wrapper = optim_wrapper['generator']
        g_optim_wrapper.zero_grad()
        with g_optim_wrapper.optim_context(self):
            losses_g_double = self.g_step(batch_outputs, batch_gt_data)

        parsed_losses_g, log_vars_g = self.parse_losses(losses_g_double)
        loss_pix = g_optim_wrapper.scale_loss(parsed_losses_g)
        g_optim_wrapper.backward(loss_pix)
        g_optim_wrapper.step()

        return log_vars_g

[docs]    def d_step_with_optim(self, batch_outputs: torch.Tensor,
                          batch_gt_data: torch.Tensor,
                          optim_wrapper: OptimWrapperDict):
        """D step with optim of GAN: Calculate losses of discriminator and run
        optim.

        Args:
            batch_outputs (Tensor): Batch output of generator.
            batch_gt_data (Tensor): Batch GT data.
            optim_wrapper (OptimWrapperDict): Optim wrapper dict.

        Returns:
            dict: Dict of parsed losses.
        """

        log_vars = dict()
        d_optim_wrapper = optim_wrapper['discriminator']
        d_optim_wrapper.zero_grad()
        with d_optim_wrapper.optim_context(self):

            loss_d_double = self.adv_lambda * self.d_step(
                batch_outputs, batch_gt_data)

        parsed_losses_df, log_vars_df = self.parse_losses(
            dict(loss_d=loss_d_double))
        log_vars.update(log_vars_df)
        loss_df = d_optim_wrapper.scale_loss(parsed_losses_df)
        d_optim_wrapper.backward(loss_df, retain_graph=True)
        d_optim_wrapper.step()

        return log_vars

[docs]    def extract_gt_data(self, data_samples):
        """extract gt data from data samples.

        Args:
            data_samples (list): List of DataSample.

        Returns:
            Tensor: Extract gt data.
        """

        batch_gt_data = data_samples.gt_img

        return batch_gt_data