图像超分辨率技术指的是根据低分辨率图像生成高分辨率图像的过程,该技术希望根据已有的图像信息重构出缺失的图像细节 。视频超分辨率技术则更加复杂,不仅需要生成细节丰富的一帧帧图像,还要保持图像之间的连贯性 。
在一篇名为「Temporally Coherent GANs for Video Super-Resolution (TecoGAN)」的论文中,来自慕尼黑工业大学的研究人员提出了一种用于实现视频超分辨率的新型 GAN——TecoGAN 。
此前,已经有开发者利用 ESRGAN 这种视频超分辨率模型重制了很多单机游戏,包括经典的重返德军总部、马克思·佩恩和上古卷轴 III:晨风等等 。重制的高清版游戏在画质上有很好的效果,而且还保留了原始纹理的美感与风格 。
以下三幅动图的右半部分是用 TecoGAN 生成的,说不定用它来重制单机游戏会有更惊人的效果 。该方法能够生成精细的细节,较长的生成视频序列也不会影响其时间连贯度 。
图中,动物皮的网格结构、蜥蜴的图案和蜘蛛背部的斑点无不彰显该方法的效果 。该方法中的时空判别器在引导生成器网络输出连贯细节方面居功至伟 。
这个视频超分辨率 GAN 牛在哪里?自然图像超分辨率是图像和视频处理领域的一大经典难题 。对于单一图像超分辨率(SISR),基于深度学习的方法可以达到当前最佳的峰值信噪比(PSNR),而基于 GAN 的架构在感知质量方面实现了重大改进 。
在视频超分辨率(VSR)任务中,现有的方法主要使用标准损失函数,如均方差损失,而不是对抗损失函数 。类似地,对结果的评估仍然聚焦于基于向量范数的指标,如 PSNR 和结构相似性(Structural Similarity,SSIM)指标 。与 SISR 相比,VSR 的主要难点在于如何获取清晰的结果,且不会出现不自然的伪影 。基于均方差损失,近期的 VSR 任务使用来自低分辨率输入的多个帧 [13],或重用之前生成的结果 [28] 来改进时间连贯度 。
【视频格式转换大师破解版 免费视频高清修复清晰软件】尽管对抗训练可以改善单个图像的视觉质量,但它并不常用于视频 。在视频序列案例中,我们不仅要研究任意的自然细节,还要研究可以稳定形式基于较长图像序列生成的细节 。
该研究首次提出了一种对抗和循环训练方法,以监督空间高频细节和时间关系 。在没有真值动态的情况下,时空对抗损失和循环结构可使该模型生成照片级真实度的细节,同时使帧与帧之间的生成结构保持连贯 。研究者还发现了一种使用对抗损失的循环架构可能会出现的新型模型崩溃,并提出了一种双向损失函数用于移除对应的伪影 。
该研究的核心贡献包括:
- 提出首个时空判别器,以获得逼真和连贯的视频超分辨率;
- 提出新型 Ping-Pong 损失,以解决循环伪影;
- 从空间细节和时间连贯度方面进行详细的评估;
- 提出新型评估指标,基于动态估计和感知距离来量化时间连贯度 。
论文链接:
https://arxiv.org/pdf/1811.09393.pdf
摘要:对抗训练在单图像超分辨率任务中非常成功,因为它可以获得逼真、高度细致的输出结果 。因此,当前最优的视频超分辨率方法仍然支持较简单的范数(如 L2)作为对抗损失函数 。直接向量范数作损失函数求平均的本质可以轻松带来时间流畅度和连贯度,但生成图像缺乏空间细节 。该研究提出了一种用于视频超分辨率的对抗训练方法,可以使分辨率具备时间连贯度,同时不会损失空间细节 。
推荐阅读
- 视频有哪些格式的文件 三个常见的视频格式
- pdf转换成照片格式 同时打开多个pdf文件
- 抖音极速版视频收益怎么算 抖音极速版发布视频有收益吗
- 冰菜怎么种植方法 冰菜怎么种植视频
- iphone6p更换电池教程 iphone6p换电池教程视频
- ipad新手使用指南视频 苹果ipad新手使用指南
- 会声会影如何导出视频大小和手机一样 会声会影怎么调视频尺寸大小
- 电脑c盘可以格式化吗格式化步骤 电脑c盘格式化会怎么样
- wps怎么设置字体格式 wps怎样导入字体
- 相机的sd卡无法读取要格式化 相机SD卡无法格式化