百科问答小站 logo
百科问答小站 font logo



如何评价 4 月 1 日张国荣超清修复版《热 • 情演唱会》?像素级还原 22 年前演唱会是什么体验? 第1页

  

user avatar   jzwa 网友的相关建议: 
      

这个兄弟把我的想法说出来了。

修复的效果怎么说呢,就是让人仿佛感觉不到那份时间的沉淀感。

实在是让太让人怀念了,家人们。

在讨论修复的难度有多高前,我们先来对于分辨率有一个大概的了解,分辨率(Image resolution)泛指显示系统对细节的分辨能力,通俗点来说分辨率可以理解为影像的清晰度[1]。分辨率越高代表影像质量越好,越能表现出更多的细节;但相对的,因为纪录的信息越多,文件也就会越大。

随着影视拍摄技术和显示技术的提升,各类型显示器的分辨率也在不断的优化进步,我们小时候经常看的DVD碟子一般是720 * 480像素的分辨率,而以前常见的1080P的显示器一般是1920*1080像素的分辨率。这是什么概念呢,同样大的一个屏幕, 1080P的像素点(pixel)有207万+,而DVD像素点只有34万多,差不多6倍左右的信息量。

那么4K是个什么概念,根据常用的4K分辨率标准 3840 * 2160,像素点足足有将近830万个,下图也能直观的反应出

而以前的各种影视作品,大多是由DVD保存的,本身的分辨率低就不说了,更主要的是经过了很长的时间,保存过程中难免会磕磕碰碰,这样就会产生各种划痕、噪点等问题。更说别张国荣在00年的这张演唱会了,时间跨度长达22年,即使再妥善保存,也是免不了各种各样的问题。

针对这种问题,应运而生的让老片子重换新生的技术就是视频修复(video Inpainting)

视频修复是如何做到的?

在说视频修复之前,先拿图像举例,因为本质上视频就是由一帧帧的图像组成的,图像修复在我们日常生活中非常的普遍。

比如PS就是对于图像的修复,比如将某个物体P掉,就是图像修复的一种手段。同时也可以增强画质,修改亮度、对比度等等,甚至将原本的颜色重新替换掉。


上述的图像增强就是把花去掉,通常上有两种做法:

1 复制粘贴(copy and paste):从图像周围找相似的像素点然后复制粘贴过来

2 生成式 (generative):根据整个图像的内容「创造」出来

这两种方法各有优缺点

第一种复制粘贴式逻辑较为简单,如果周围的图像比较简单,那么效果就会不错。但是如果周围并没有跟想要修复的区域有相似的像素,那么这种方法就巧妇难为无米之炊了。

这个时候第二种方式就比较合适了,因为它可以从别的相似图像中找到共同点,但同样的计算量也会远远超过第一种。

为什么视频修复要比图像修复难度高很多?

前面我们说过了视频其实就是图像的组合,那么修复视频也就可以理解为修复很多种图像,那么无非就是花费多一些时间和计算资源了。

其实远远不是这样的,视频修复面临着比图像修复最复杂的一个点是「时间一致性」(temporal consistency)。理想的情况应该是随着时间的推移,逐渐变化的视频不应该出现闪烁或修复区域中对象的颜色或形状的突然变化。 并且有许多变量会影响实现时间一致性的难度——场景的复杂性、摄像机位置的变化、场景的变化或进行修复的选定区域的移动(例如移动对象)。

看过演唱会的同学们应该也知道,演唱者可能会很活泼,从这边跑到那边,同时全场可能会有几十个机位[2],那么拍摄到的演唱者的角度都会不同,那么这种大融合的演唱会视频的修复难度可想而知。


在以前图像的修复往往是手工完成的,而视频修复是无法使用人工的,还是因为「时间一致性」。因为人工修复的话往往会面临着对于不同参数和场景设置的理解偏差,比如对于明暗的理解,每个人都有自己的理解。

只有机器是无情的,他们可以无情的按照统一的格式对视频进行修复。再加上现在深度学习的发展,更是将视频修复的能力推上了更高的层面。

现在用于做视频修复的深度模型主要有两种:长短期记忆(Long short-term memory, LSTM)和Transformer,前者是很成熟的用于处理时间序列的模型,它可以很好的用来追踪视频中的时间信息,从而满足时间一致性的需求。后者是近几年来炙手可热的深度学习宠儿,它更是可以将计算集中到指定的区域,当然更高的性能也会要求更高的计算量。

如何让修复出来的视频具有沉浸感?

单纯的增加视频清晰度对于现在的深度学习模型已经不是什么大的挑战了,但不同于普通的视频修复。

演唱会最重要的体验就是「沉浸感」,也就是一种身临其境的感觉,单纯的清晰度提升无法做到这些。而这也是张国荣演唱会视频修复的难点,再加上演唱会视频中的色彩、画面切换很快,外加视频素材清晰度不高等问题。

赋予老旧视频「沉浸感」的技术就来源于腾讯云多媒体超高清沉浸感修复引擎。

用鱼骨图来展示的话,基本上可以分为四个步骤,其中鱼尾输入的是老旧视频,而鱼嘴输出则是经过智能编码的高清视频。

① 智能分析

这一步主要是对老旧视频进行全方位和多维度分析,主要为了评估视频的运动和纹理复杂度、压缩失真程度等。

这些结果可以对视频进行评估,同时也可以进行修复提供提供细节补充。

② 画质修复

画质修复就会对视频中具体的问题就是针对性的修复了,包括但不限于划痕、竖线、雪花点、噪声、压缩失真、抖动等问题。

这些修复工具值得注意的是往往市面上有没有非常优秀的开源接口,比如说划痕处理。划痕是指视频图像中亮或者暗的线条,它通常有3~10像素宽,近似垂直,本身亮度具有一致性,与邻域图像无关。

划痕处理算法市面上并不算少,但是限制深度学习算法的不仅仅是算法本身,还依赖于数据库的丰富程度。因为深度学习对于没有见过的划痕会比较费解,对于这种特殊数据的收集是一种耗时耗力的工作。

腾讯云多媒体实验室采用的就是数据增强(data augmentation)的方法,可以理解为使用一小部分真实样本去生成大量的近似真实样本,从而提升算法的整体性能。

这种算法在超高清沉浸感修复引擎还有很多,也都在张国荣的演唱会视频修复中频频出现。

③ 画质增强

画质增强主要是提供对视频画质的全方面增强,主要是在在空间和时间上提升视频的分辨率和帧率,在空域上提升细节清晰度、色彩丰富度。

④ 智能编码

要知道一两个小时的4k视频可能高达几十甚至上百个G,如果想要实现全球直播,这么大的数据量可能会让某些观众当场欠费。那么智能编码做的就是个事,它可以智能的进行自适应编码,目的就是在减少文件大小的情况下,还能保持相当高的视频质量,以便进行视频的传输。

说到这儿,H.266/VVC标准就是实现视频编解码的神器,它可以在视频主观质量不变的条件下减少50%的数据大小,大大减少视频传输带来的流量、带宽成本,推动整个视频产业进化,腾讯云多媒体实验室正是这项标准制定的主要贡献者之一。

这么一套组合拳下来可以让老旧视频重焕新生,同时让清晰的视频高质量、流畅的进行现场直播。

写在最后

相信很多是B站的用户,而谭乔的《二仙桥》大爷则是经典中的经典,很多流传的视频其实画质很一般,而谭乔自己的号上的视频大多较为高清,这就是视频修复技术运用的典型。

再加上工信部、国家广电总局、中央广播电视总台联合印发的《超高清视频产业发展行动计划》明确提出了,到2022年,超高清视频产业发展产业规模将超过4万亿元,每年都需要制作超过 30,000 小时超高清内容。

但在超高清内容制作方面,存在制作成本高、效率低的痛点,如何可以流程化的高效的进行视频修复是一个刚需。

腾讯云媒体实验室现有的技术可以视为一个视频修复的技术矩阵,利用数字技术帮助传承传统文化和经典作品,也是一种的科技向善的体现。

参考

  1. ^ https://zh.wikipedia.org/wiki/%E5%88%86%E8%BE%A8%E7%8E%87
  2. ^ https://pro.sony/cn/academy/news/details.html?id=news_2019_2020&year=2020&s=news

user avatar   shan-feng-77-41 网友的相关建议: 
      

《热·情演唱会》真的很绝,舞美设计大胆前卫,造型颠覆了大众认知,如果不说,你绝对不会想到是20年前的作品。

即使在今天,我还是会惊叹于他这场演唱会的造型和艺术理念。

真的很感谢科技的进步,能够永远留存风华正茂的张国荣,让岁月之音和绝世的容颜,穿过悠悠岁月重返时光。

让来不及经历张国荣的时代,或者是来不及见一见他的歌迷朋友,让所有和想念、怀念张国荣的人,都能因为一个理由重聚在一起。

因为演唱会和千禧年的哥哥重逢,本身就是一件很有意义的事情。

今晚,我们不见不散。





  

相关话题

  2021 年互联网流量格局发生了什么变化?2022 年会如何发展? 
  如何看待「橘子皮能破解指纹」的媒体报道?指纹锁被破解的真实原因是什么? 
  如何看待女子跟外公拍的写真被造谣成「 73 岁富豪娶 29 岁美女」?造谣者将承担怎样的法律责任? 
  如何看待「监控视频显示杭州一外卖员用“脚踢着外卖”走进小区」?平台对骑手的管理严格吗?怎样才能约束? 
  2019 年 3 月 25 日举办的 Apple 特别活动有哪些亮点和槽点? 
  孩子说「有了我,爸爸才能过父亲节,爸爸应该谢谢我」你怎么回答? 
  因试用期遭劝退,一男子为发泄情绪删光自己在职期间所写系统代码被判刑十个月,如何看待这一审判结果? 
  大连一市场火灾造成 8 人死亡,1 名消防员殉职,事故因企业违规使用电焊动火作业所致,具体情况如何? 
  美媒用美国等地的死亡率,声称推算出「中国新冠死亡病例有170万」,这种算法的漏洞有哪些? 
  如何看待 5 名赴越专家感染印度变异病毒,目前情况如何? 

前一个讨论
2022 年初,你认为哪项成果代表了现在人工智能的最高水平?
下一个讨论
多任务学习成功的原因是引入了别的数据库还是多任务框架本身呢?





© 2024-12-22 - tinynew.org. All Rights Reserved.
© 2024-12-22 - tinynew.org. 保留所有权利