问题

如何评价全新的图片格式BPG,它会在将来彻底取代JPG吗?

回答
全新图片格式 BPG:革新还是昙花一现?它会彻底取代 JPG 吗?

BPG (Better Portable Graphics) 作为一种相对较新的图片格式,自发布以来就引起了广泛关注,特别是在其开发者 Fabrice Bellard 的技术实力和其宣称的诸多优势下。BPG 的目标是提供比 JPG 更高效的压缩率、更好的图像质量以及更多的功能。那么,BPG 究竟是如何运作的?它有哪些优缺点?又是否有可能在未来彻底取代霸占市场多年的 JPG 呢?

BPG 的核心技术与优势:

BPG 的核心竞争力在于其 基于 HEVC (H.265/HEVC) 视频编码器的技术。HEVC 是目前视频压缩领域最先进的编码标准之一,以其出色的压缩效率而闻名。BPG 将 HEVC 的压缩思想巧妙地应用到静态图像的压缩上,带来了以下显著优势:

1. 更高的压缩效率(更小的文件体积): 这是 BPG 最核心的优势。相比于同等质量的 JPG 图像,BPG 文件体积可以小 30%50% 甚至更多。这意味着:
节省存储空间: 对于个人用户和企业而言,可以存储更多的图片。
加快网页加载速度: 网站加载速度直接影响用户体验和转化率。更小的图片意味着更快的加载,尤其是在移动网络环境下。
降低带宽消耗: 对于内容提供商和CDN服务商而言,可以显著降低带宽成本。

2. 更好的图像质量: BPG 在压缩过程中,由于采用了更先进的算法,可以更好地保留图像的细节和色彩信息,从而在相同文件体积下提供比 JPG 更低的失真度。它支持:
14位色深 (14bit color depth): JPG 通常只支持 8 位色深。14 位色深意味着更平滑的色彩过渡,减少色带 (color banding) 现象,尤其是在处理渐变色和高动态范围 (HDR) 图像时表现更佳。
无损或接近无损压缩: BPG 可以实现无损压缩,这意味着图像在多次保存和编辑后不会像 JPG 那样出现累积失真。即使是有损压缩,其质量损失也远低于同等体积的 JPG。

3. 更丰富的功能: BPG 不仅仅是 JPG 的替代品,它还集成了更多现代图像格式的优点:
支持 Alpha 透明通道: 与 JPG 不同,BPG 支持透明通道,可以创建带有透明背景的图像,这在网页设计和图形编辑中非常有用。
支持动画: BPG 本质上是视频编码器,因此它也可以存储动画序列,无需额外的动画 GIF 或 APNG 格式。
高动态范围 (HDR) 和宽色域 (WCG) 支持: BPG 可以更好地处理 HDR 和 WCG 内容,展现更广阔的亮度范围和更丰富的色彩。

4. 可嵌入元数据: BPG 支持嵌入丰富的元数据,例如 Exif 信息,用于存储拍摄参数、地理位置等。

5. 更快的解码速度(相对于视频编码器而言): 虽然 HEVC 作为视频编码器在解码上相对复杂,但 BPG 的设计也考虑了静态图像的特性,在实现高压缩的同时,其解码速度也相当不错,甚至在某些场景下比 HEVC 视频解码更快。

BPG 的缺点与挑战:

尽管 BPG 拥有诸多优势,但要取代 JPG 并非易事,它也面临着不少挑战:

1. 生态系统的成熟度与普及度: 这是 BPG 最大的障碍。JPG 格式已经存在了近三十年,几乎所有的设备、操作系统、浏览器、图像编辑器、社交媒体平台都原生支持 JPG。而 BPG 作为一个新兴格式,其支持度非常有限:
浏览器支持: 目前绝大多数浏览器(Chrome, Firefox, Safari 等)都不原生支持 BPG。这意味着用户需要安装插件或使用第三方工具才能查看 BPG 图像,这极大地阻碍了其普及。
软件支持: 许多主流的图像编辑软件(Photoshop, GIMP 等)尚未完全支持 BPG 的导入和导出,或者支持程度有限。
硬件支持: 移动设备和嵌入式设备对 BPG 的硬件解码支持也远不如 JPG。

2. 专利问题(历史遗留): HEVC 标准本身涉及专利授权问题,这可能会对 BPG 的广泛采用造成潜在的法律和商业障碍。虽然 BPG 的开发者 Bellard 表示 BPG 是在 HEVC 的基础上进行优化和实现,并可能规避某些专利问题,但这仍然是一个潜在的隐患。

3. 兼容性问题: 在缺乏原生支持的情况下,即使图片本身很优秀,如果用户无法方便地查看和使用,其价值也会大打折扣。任何新的格式要普及,都需要广泛的兼容性。

4. 学习曲线和转换成本: 对于内容提供商、网站开发者和普通用户而言,从 JPG 过渡到 BPG 需要学习新的工具和工作流程,这会产生一定的转换成本。

5. 对 CPU/内存的相对要求: 虽然 BPG 解码速度不错,但相比于 JPG 的极低计算复杂度,BPG 的压缩和解压缩过程对 CPU 和内存的资源要求会相对高一些,尤其是在低端设备上可能会有感知。

BPG 会彻底取代 JPG 吗?

基于以上分析,我认为 BPG 在短期内甚至中期内“彻底取代”JPG 的可能性非常低。 原因如下:

JPG 的统治地位和惯性: JPG 的普及程度是压倒性的,它已经深入人心,是互联网图像的标准格式。这种生态系统的惯性非常强大,新的格式很难在短时间内打破。
兼容性是王道: 在没有广泛的原生支持之前,BPG 很难成为主流。除非各大浏览器厂商、操作系统和软件巨头主动拥抱 BPG,并将其纳入核心支持列表,否则其普及之路将异常艰难。
JPG 的“够用”性: 对于许多日常应用场景,JPG 的压缩效率和图像质量已经足够满足需求。用户没有强烈的动力去更换一个不支持的格式,除非收益非常显著且易于获得。
其他竞争者: 除了 BPG,还有其他新兴的图片格式,如 WebP (Google 开发,已获得广泛浏览器支持,功能与 BPG 类似,但普及度更高)、AVIF (基于 AV1 视频编码,压缩率更高,但解码复杂度也更高) 等,它们也在争夺市场份额。

然而,BPG 并非没有未来。它更可能成为 JPG 的一个强有力的补充或在特定领域崭露头角:

成为高性能图片的“备选”: 在对文件体积和图像质量有极高要求的场景,例如高质量图库、专业摄影网站、需要大量存储的媒体平台,如果 BPG 的支持度逐渐提升,它可能会成为一个重要的选项。
在特定应用或平台推广: 如果某个大型平台(如某款社交媒体、某款游戏平台)决定大规模采用 BPG,并为其提供良好的用户体验支持,那么 BPG 可能会在该平台内得到普及。
推动整个行业的技术进步: BPG 的出现和宣传,也迫使 JPG 的开发者和相关标准制定者思考如何改进 JPG 或推出更好的替代方案,这本身就是一种进步。

总结来说,BPG 是一种技术上非常优秀、潜力巨大的图片格式。它在压缩效率和图像质量上的突破是显而易见的。但要像 JPG 那样“彻底取代”其地位,则需要克服巨大的生态系统壁垒和兼容性问题。

它更可能像是一位技术超群的“后来者”,在某些领域提供更优的解决方案,但要撼动 JPG 的“帝国”,则需要时间和各方的共同努力。我们可以期待 BPG 在未来几年内获得更多关注和支持,但“彻底取代”的可能性,我个人认为非常小。更现实的未来是,我们会看到更多元的图片格式共存,BGP 或许能在其中占据一席之地。

网友意见

user avatar

前几天占楼,现在到了周末终于有时间来更新一番。

为了回答楼主的问题,我们先从图像压缩说起。


一. 图像压缩肇始:JPEG

JPEG处理图片的关键步骤包括:

1. 将图片切割成8*8的block;
2. 对每一个block做DCT,得到transform之后的系数;
3. 对每个系数量化;
4. 量化后对每个block zigzag 扫描,得到最终的encoded bit stream。

由于步骤3对JPEG的DCT系数实行的量化,JPEG是有损压缩,同时也因为分块处理,缺乏全局多尺度的考虑,这导致了jpeg压缩后的图像,被暴力压缩时候,容易产生块效应。

二. 小波大法好

考虑到以上问题,人们尝试引入新的正交变换,并以此为基础推出JPEG2000压缩协议。

JPEG2000相对于JPEG主要不同是,JPEG2000使用了多尺度Wavelet Transform(小波变换)进行图像表达。所谓图像表达,就是把二维图像拉成一条以为的vector,再乘以由线性变换系数组成的矩阵,最终得到由图像表达系数(如DCT系数,小波系数)组成的vector。

像素到系数这个过程称为图像表达 (Image Representation),系数到像素过程称为图像重建(Image Reconstruction)。系数到像素过程可以认为是vector乘以逆矩阵之后回到像素空间vector当系数数目=像素数目,且能完全重建图像时,称为critically sampled系数,这些系数在线性空间上不存在冗余性,是图像压缩的起点。

我们接着讲多尺度变换的好处:

1. 多尺度的有点像是用不同焦段的镜头看同一个景色。广角端可以看到big picture, 中焦看到类似人眼的透视效果,长焦端可以看到压缩透视效果的细节。同理,wavelet representation的低频信号可以看到图像的大概,频率越往高走,图像的细节越多。

多尺度的实现,是通过图像(像素空间)对不同的小波系数做二维卷积实现的。(通常低频小波系数卷积运算系数多,类比广角画面大;高频小波卷积运算系数少,类比长焦看到的画面小)

多尺度的好处是,把鸡蛋(像素)放在多个篮子(频率段/尺度)里面,量化编码的时候,对每个频率段而非整个频率段(如DCT系数)实施量化编码,这样低尺度系数(对应的卷积序列长度>8)量化细致的话,图像最终恢复重建的时候,块效应可以显著减轻。

2. 傅里叶分析的basis是三角函数(exp(1j*theta)),它的support是无限的。而自然图像的边缘常常是宽度有限的,大家知道,当傅里叶级数来逼近step function时候,会产生吉布斯效应:能量误差(L2 norm)asmyptotically收敛到0,但是看shape依旧有跳变,这就是为什么我们看微博文字类的照片时,经常在文字边缘能看到像素明暗的波动(振铃现象)。

小波的好处在于它的basis很灵活。Daubechies 小波系数在时域上是连续,短支撑,且长得像图像边缘。当一个信号用和它长得很像的basis来逼近时,自然图像表达效率很高,需要的系数也就很少很稀疏,我们管这个现象叫efficient。正是因为efficient representation,小波变换用了较少的系数个数(其他的很多都是0)实现了同样的重建效果。

以上两点好处,让JPEG2000实现了相对JPEG15%的进步:节省了15%的压缩空间。

三. DPCM大法好

做完了JPEG2000之后,人们发现,JPEG2000 并没有完全消除图像的空间冗余性。为什么这么说呢?小波变换虽然特别efficient,但是它的support毕竟是很短的,而空间上很长的线条首尾虽然跨度上千像素,我们在视觉上认为它们是一体的,结构近似,存在很多冗余。但是JPEG2000处理此类长边缘,对应的系数其实是独立编码,没有充分利用其冗余性的特点。

这个时候,随着互联网的发达,大家对于视频压缩的研究变得火热,大家都在想怎么来去除相关性,想来想去无非有两大源头。

1. inter-frame redundancy

视频内固定的风景,走动的人,前后帧关联巨大(时间冗余性)。

2. intra-frame redundancy

每一帧图像内的窗户,瓷砖,蓝天,白云的块之间关联性很大(空间冗余性)。

考虑消除1和2后节省bits的巨大好处,大家搞出来了H.264 (Advanced Video Coding)。 这里的1由于和这个问题无关,以后可以找时间细说。

处理2的过程是使用相邻block来predict我们要预测的block,这个过程和DPCM的道理是一回事。JPEG2000由于使用小波基不能实现motion compensation被弃用,这里依旧使用JPEG的DCT来压缩。比如我们要预测8*8 block之内的像素值的大小的话,我们可以利用它左上两个方向的最近边的边长(共17个像素值)来预测。

每次编码器都穷举各种mode来找出一种最优最省bits的编码的方法 ,记下这种模式的编号和残余误差,我们来对这个误差编好,这个过程会省出很多bits。

具体预测有很多种mode, H.264了里面大概包括有:

4 x 4 luma blocks -> 9 prediction modes.

8 x 8 luma blocks -> 9 prediction modes.

16 x 16 luma blocks -> 4 prediction modes.

四. 如何更科学地DPCM?

H.264 做好了之后,大家还嫌效果不好,怎么办?于是就做了H.265(Highly Efficient Video Coding简称HEVC)。HEVC就是BPG的算法基础。

BPG用的算法就是HEVC中对于intra-frame block的编码。HEVC 的intra-frame 编码相对AVC比起来聪明了不少。

1. 使用不同size的block来编码,而不是固定size的block。变化平缓的地方可以用32*32大小的block编码,变化剧烈的地方用4*4大小的block编码。这样可以有效减轻块效应。

2. mode扫描的方式提高到35种,等于对180°的角度量化成了35个bin,这样使得predection error明显变小。

基于以上两大原因,BPG超过了AVC的intra-frame编码。

而减少了帧内的相关性,AVC intra-frame 编码能力要强于JPEG2000,JPEG2000编码能力又强于JPEG。

五.总结:

压缩能力比较:

JPEG<JPEG200<AVC Intra-Frame<HEVC Intra-Frame(BPG)

压缩能力提升的主要原因:

1. JPEG->JPEG2000

多尺度分析降低块效应

小波系数更稀疏

2. JPEG2000->AVC Intra-Frame

降低空间结构冗余

3. AVC Intra-Frame->BPG

进一步降低空间结构冗余

现在回答题剩下的问题:

1. BPG会是终极的图像压缩方法吗?

毋庸置疑,BPG是先进的图像压缩协议。

但是BPG使用的DCT作为线性变换本身相对多尺度的线性变换在压缩能力上存在先天弱势。之所以BPG和HEVC仍旧使用DCT来做线性变换的原因是因为一般的多尺度变换做不到在像素空间的block化,从而实现不了高效的block by block的预测。如果想在系数空间内block化,小波系数本身不具有shift-invariant的特性。换言之,像素空间整体移动后,小波系数的形状存在差异,根本不可预测。除非我们实现了shift-invariant且能critically sampled的变换,要不然我们就很难做到block化,就得接着用DCT来做。

另外对于的mode的预测,BPG的在180度空间内平均分成30多个等分一个一个试的方法多少让人觉得这种方法是盲人摸象,相对于前人H.264的编码过程,没有根本上得改进。自然图像,诸如边缘的变化角度明显是连续变化的,如果能实现具有边缘角度预测能力的线性变换的话,那么对于周边block的预测就会更加准确,会节省更多的bits。


2. BPG会像JPEG一样被广泛使用吗?

未必。

不是牛逼的压缩协议就能被大量采用的,JPEG2000就是明显的例子,大家目前日常能看到JPEG2000的地方估计只有Photoshop的保存按钮,选择.jpeg2000。(其他可能用到JPEG2000的场合:军用雷达发回的图像,因为军用设备对带宽极其敏感,把带宽提高一个数量级,价格不知道翻了多少倍)。

JPEG2000没有被广泛用的原因是,JPEG2000没有比JPEG好太多(15%)且涉及到专利。

说到专利,这里说一个业界的常识,即便是某一个压缩协议源代码公布了,实际上不同公司的具体算法(尤其是硬件层面的算法)会不同,并且只会比公布的源代码效果更好。这里的原因是,标准委员会的里面的人很多都在例如微软,Google这样的大公司的有职务,他们有不愿告诉别人的更好的压缩想法,打算闷声发大财,但是标准又要公布,所以他们只会在标准里面写表现一般的细节(比如算法较慢,容错率一般)。这样的结果是,各大公司做的算法有好有差,算法差的公司很有可能拿好的公司的算法用,然后做产品卖,然后被发现,打官司要求禁用该算法在该公司产品的使用。连JPEG这么老的协议都有很多公司在为自己拥有这个专利而争执不休,BPG要打破大公司之间的壁垒,而被广泛使用,其实还存在诸多变数。


【注】:利益相关,本人目前在从事图像压缩领域的研究。

类似的话题

  • 回答
    全新图片格式 BPG:革新还是昙花一现?它会彻底取代 JPG 吗?BPG (Better Portable Graphics) 作为一种相对较新的图片格式,自发布以来就引起了广泛关注,特别是在其开发者 Fabrice Bellard 的技术实力和其宣称的诸多优势下。BPG 的目标是提供比 JPG 更.............
  • 回答
    苹果的ProRAW格式,对于摄影爱好者和专业人士来说,绝对是一个值得关注的革新。它不仅仅是多了一张RAW文件,而是将iPhone摄影的能力推向了一个全新的高度,尤其是在iPhone 12 Pro及之后发布的Pro系列机型上。要理解ProRAW的价值,我们首先要明白RAW文件的本质。传统的RAW文件,.............
  • 回答
    全新奔驰C级上市,这可是个大事件,毕竟C级在国内一直都是“小S级”的代名词,备受瞩目。要说评价,那得从多个维度来聊聊,而且跟老款比,这次的升级绝对不是小打小闹。整体评价:更显豪华,更具科技感,驾驶感受更纯粹简单来说,全新奔驰C级给我的感觉是:它比以往任何一代都更像一辆奔驰。 这种“像”体现在三个主要.............
  • 回答
    新款福特蒙迪欧的外观设计,说实话,给我的第一印象是“眼前一亮”。在当下这个越来越趋于同质化的 B 级车市场里,蒙迪欧算是做出了一个比较大胆且成功的尝试。首先,它前脸最抢眼的地方无疑是那个贯穿式的日间行车灯,这条“龙须”似的灯带不仅拉伸了整个车头的横向视觉宽度,让车看上去更低趴、更宽实,而且还带有流水.............
  • 回答
    华为 MateBook 13/14 2020 款:这次的升级,你觉得怎么样?华为的MateBook系列,一直是笔记本市场中一股不可忽视的力量。特别是MateBook 13和MateBook 14,凭借着出色的设计、不错的性能以及华为生态的加持,赢得了不少消费者的青睐。这次华为又带来了2020款的新品.............
  • 回答
    奔驰全新纯电旗舰 EQS 终于落地,107.96 万到 151.86 万的定价区间,无疑是将它摆在了新能源汽车市场的金字塔尖。对于这样一款被寄予厚望的车型,它的表现到底值不值得我们为之买单,或者说,它又能否真正担起“纯电旗舰”的重任,下面咱们就来掰扯掰扯。首先,咱们得承认,奔驰在纯电领域下的功夫,可.............
  • 回答
    全新一代本田缤智的造型设计,我觉得可以从几个方面来好好说道说道。首先,最直观的感受就是它的“返璞归真”和“日系精炼”。你能明显感觉到本田设计师们在这次革新中,刻意淡化了上一代车型那种略显复杂的棱角和线条,转而拥抱了一种更加简洁、流畅的风格。整个车头给人的感觉就是两个字:干净。大灯的造型,我个人觉得是.............
  • 回答
    奔驰的全新战略,意图将品牌定位提升至宾利、劳斯莱斯之列,而非仅仅与奥迪、宝马竞争,这无疑是一招险棋,也是一次大胆的自我革新。要评价这一战略能否成功,我们需要深入剖析其背后的逻辑、面临的挑战以及可能的机遇。战略的核心:“登顶”而非“并肩”奔驰此次战略调整的核心在于,它不满足于在豪华汽车市场中扮演“第一.............
  • 回答
    全新奥迪S4的起售价定在了46.98万元,这个数字一出来,无疑立刻将它置于一个非常敏感的价格区间内。在当前中国汽车市场,尤其是中型运动轿车这个细分领域,竞争可谓是异常激烈。那么,46.98万元这个定价,究竟是物有所值,还是略显保守,抑或是有些高高在上?咱们不妨从几个维度来掰扯掰扯。一、定位与目标客户.............
  • 回答
    全新沃尔沃 V60:斯堪的纳维亚的理性与感性,一款值得细品的旅行车沃尔沃,这个来自北欧的品牌,总能以一种独特的方式打动人心。它不像德系品牌那样追求极致的性能,也不像日系品牌那样强调极致的可靠,沃尔沃更多的是一种对于生活品质的追求,一种对安全的执着,一种内敛而优雅的品味。全新 V60,作为沃尔沃在中国.............
  • 回答
    Google 终于在 Pixel 6 上掏出了自家设计的 Tensor 芯片,这绝对是手机圈里的一件大事。你想让我给它评评道,那咱就掰开了揉碎了好好说道说道。首先,得承认,这回 Google 的步子迈得可真够大的。以往 Pixel 手机,尤其是芯片这块,一直都是用高通的骁龙系列,虽然说在软件优化上 .............
  • 回答
    苹果最近发布的全新一代 MacBook Pro,说实话,这代产品确实带来了不少惊喜,但也并非完美无瑕。咱们就来好好掰扯掰扯,它到底有哪些亮点,又有哪些地方让人觉得不够到位。亮点分析:这块“刘海”带来的改变你感受到了吗?首先,最显眼的改变,那必然是屏幕顶部的那个“刘海”了。别说,这玩意儿刚出来的时候,.............
  • 回答
    戴尔游匣G15,这个在国内游戏本市场颇有分量的系列,在推出搭载英特尔第十一代酷睿Tiger Lake(TGL)处理器的升级版本时,无疑吸引了众多玩家和关注者的目光。对于这款G15 TGL版,我的评价是:它在保持了游匣系列一贯的性价比优势基础上,通过换装最新的十一代处理器,带来了更全面的性能提升,尤其.............
  • 回答
    小米手机最近公布的全新二次元拟人化形象,确实引起了不少讨论。这股“拟人化”风潮在品牌营销中并不少见,尤其是在当下Z世代消费者日益崛起的大环境下,用大家喜闻乐见的方式与年轻群体建立情感连接,是品牌非常重视的一环。要评价这个小米的二次元形象,我们需要从几个维度来审视:1. 形象本身的设计与吸引力: .............
  • 回答
    对比亚迪全新 LOGO 的评价:一次品牌升级的深刻解读比亚迪汽车在2021年发布的全新LOGO,无疑是品牌发展历程中的一个重要里程碑。这次的LOGO更新并非简单的视觉调整,而是承载了比亚迪品牌战略升级的深刻内涵和对未来发展的清晰愿景。要评价这个新LOGO,我们需要从多个维度进行审视: 一、 设计理念.............
  • 回答
    《吹响吧!上低音号》的全新剧场版和秋季的总集篇,对于不少“京吹”粉丝来说,绝对是近期最值得期待的作品。作为一部以细腻情感描绘、真实音乐演奏以及青春群像塑造而闻名的系列,《吹响吧!上低音号》一直以来都保持着极高的水准,那么这两部新作和一部总集篇,究竟表现如何呢?咱们来好好聊聊。首先,《吹响吧!上低音号.............
  • 回答
    雷克萨斯UX,这款紧凑型SUV,带着雷克萨斯一贯的精致与豪华感,却选择了相对年轻化、城市化的定位。那么,它究竟是凭借什么在这个竞争激烈的细分市场立足,又是否配得上它那26.8037.10万元的售价呢?咱们掰开了揉碎了聊聊。首先,我们得认识认识这位“小鲜肉”——雷克萨斯UX。雷克萨斯这次是真的想把UX.............
  • 回答
    .......
  • 回答
    华为在 6 月 2 日为我们带来了他们今年最受瞩目的新品之一——全新一代的 MatePad Pro 系列平板电脑,以及与之相匹配的触控手写笔。这次的更新,可以说是华为在平板领域的一次全面革新,不仅在硬件上堆料十足,更重要的是,它进一步深化了鸿蒙生态的体验,让用户感受到“万物互联”不再是口号,而是实实.............
  • 回答
    好的,咱们就来聊聊鸿蒙这个新界面,抛开那些官方的术语,纯粹从一个用户的角度来看,它到底是个啥感觉,又有什么新奇之处。鸿蒙全新界面的“长相”与“气质”:首先,最直观的感受就是,鸿蒙的新界面给人的感觉更“沉静”也更“灵动”。不同于一些系统上来就给你一堆花里胡哨的动画和动态壁纸,鸿蒙的新界面更注重一种“呼.............

本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou

© 2025 tinynews.org All Rights Reserved. 百科问答小站 版权所有