百科问答小站 logo
百科问答小站 font logo



为什么直到现在 RAR 仍然比 7Z 更流行? 第1页

  

user avatar   huang-peng-xuan 网友的相关建议: 
      

任何一样产品,如果沒有人用,那么只可能是一个原因——

它不好用。

绝对不可能是其他的原因。什么垄断啊,什么用户懒惰啊,这些原因都是不存在的。

7-Zip也是如此。

至于什么「7-ZIP比winRAR在多个方面优秀」这种说法,只是7-Zip往自己脸上贴金而已。

举个栗子,这是我公司的一个文件夹:

我就不说正宗的7-zip软件了,那玩意儿跟winRAR根本沒法比。我说说最近比较火的bandizip,这个软件也支持7z格式。

用bandizip压缩一下,选择zip格式,耗时4秒。

换7z格式压缩,耗时20秒。

zip格式压缩包的大小是79.9M,7z格式压缩包的大小是76.9M。7z格式只比zip格式小3%,但是压缩耗时多了4倍。这种情况下,7z的优势何在?

当然,我们可以修改参数。我把压缩级別调成快速压缩,再用7z格式压缩一遍,结果如下:

耗时8秒,压缩後的文件大小变成了79.8M。

同样的文件,我用winRAR,标准压缩成rar文件,耗时也就是8秒。快速压缩成rar文件甚至能达到跟zip文件同样的4秒速度。

7z总是吹它的压缩率,其真正的原因是:它能吹的也就只有压缩率了。压缩率高3% ,或者高5%,代价是压缩解压速度慢一倍以上,这沒什么值得骄傲的。

下面是谷歌官方做的一个评测:

Deflate是zip使用的算法,Lzma是7z使用的算法。把Deflate:9和Lzma:1做比较:

7z的压缩率比zip高(3.847÷3.371-1)×100%=14%

zip的压缩速度比7z高(15.5÷10.2-1)×100%=52%

zip的解压缩速度比7z高(347.3÷70-1)×100%=396%

7z別说打败rar了,它连把zip按到地上摩擦都做不到。原文是这样说的:

表明了Zopfli,LZMA,LZHAM,和 bzip2在压缩和解压缩时占用CPU时间较长,不会直接代替deflate。

Lzma算法的速度是如此之慢,以至于很多人使用7z时都误以为自己的电脑中病毒了,因为它实在是太慢了。

看看这位,他下载了一个16GB大小的7z格式的压缩包花了10分钟,然後解压缩花了10个小时。

再来做个实验。

我们知道文字类的文件是最容易压缩的。我随便下了几篇网文,加起来一千多万字,分別压缩成zip、7z、rar格式做比较。其中zip和7z用的是好压5.9版,rar用的是WinRAR5.71版,全都采用默认配置。

好压压缩成zip格式耗时2秒,压缩速度14.4M/秒,压缩率39.9%。

好压压缩成7z格式耗时30秒,压缩速度1.2M/秒,压缩率25.6%。

WinRAR压缩成rar格式耗时4秒,压缩率26%。

三个文件的大小比较:

7z凭什么取代rar?


2019年9月26日更新:

本文的所有实验都是简单且可复现的。

上面我们已经以实验的方式说明了为什么不要使用7-Zip压缩的7z格式,下面我们继续以实验的方式说明为什么不要使用7-Zip压缩的zip格式。

这次我还是不用正宗的7-Zip,我用360压缩举例说明。

新建一个文档:

用360压缩制作成zip格式:

点「压缩包语言」,选择「繁体中文」,不出意料地乱码了:

可能有人知道这是因为zip格式不支持Unicode文件名。但是同一个文件,我用2345好压制作成zip格式,换成360压缩打开:

点「压缩包语言」,选择「繁体中文」,这次沒有乱码!

这说明,用2345好压制作的zip文件,跟用360压缩制作的zip文件,是不一样的,不会出现文件名乱码。

事实真相是:並不是zip格式不支持Unicode文件名,而是用7-Zip压缩制作的zip格式不支持Unicode文件名。请注意这其中的差別。

上面说的是360压缩,怎么又跑到7-Zip上面去了?这是因为国产的所有压缩软件,除了好压之外,全都是7-Zip加了个壳。所以7-Zip有的缺点,他们全都有

我刚试了下7-Zip目前最新的19.00版本,不出意外地发现它依然不支持Unicode文件名。而只要7-Zip不支持Unicode文件名,像360压缩这种7-Zip加壳软件也绝不可能支持Unicode文件名。

现阶段最好用的压缩软件还是好压和WinRAR。

为什么不推荐bandizip呢?因为我讨厌它的推广方式。比方说下面这个表:

这个表是假的。WinZip和WinRAR都支持Unicode文件名,都支持7z的分卷压缩文件,目前也都是免费软件,剩下的「快速拖曳」和「高速压缩」我不太清楚是什么,估计也不是什么重要的东西。总之这个软件的虚假宣传很严重。



2019年9月28日更新:

这种看法是错误的。

好压、WinRAR、WinZip、bandizip这四款压缩软件制作的zip文件彼此通用,也就是说他们都是标准zip格式。

这四款软件都使用Unicode文件名,把这四款软件制作的zip文件拿到韩国去,拿到日本去,拿到世界上任何一个地方去,都不会乱码。只有7-Zip以及360压缩这种7-Zip加壳软件才会有文件名乱码问题。

实际上,对于Zip格式来说,Unicode文件名是可选的。7-Zip选择不支持Unicode文件名是有它自己的想法,因为加入Unicode支持会导致压缩包变大,然後研發7-Zip的那帮人觉得压缩率更重要,所以他们不支持Unicode。

7-Zip官网说7-Zip创建的 zip 格式比大多数其它压缩软件创建的都小 2-10%。大家都用一样的zip格式,凭什么你就比我小?就是因为7-Zip放弃支持Unicode。

「Zip格式本身沒有定义Unicode文件名」,我还真不好说这句话是错的。实际上这句话的正确说法是「Zip格式本身沒有定义一定要用Unicode文件名」,zip格式可以使用Unicode,也可以不使用Unicode,选择权在压缩软件,WinZip和bandizip的Unicode支持就是可选的。

7-Zip不加入对Unicode的支持,把压缩包缩小2-10%,它只说後者不说前者,只说好事不说坏事,这就是宣传。


2019年9月28日更新:

评论区有人指出7-Zip支持Unicode,但是需要手动添加参数。我试了一下,是真的。看来7-Zip还是能用的,只是需要使用者拥有很强的专业知识,对普通用户不够友好。

评论区有人说7-Zip默认不支持Unicode是为了兼容老的程序。这裡我给大家看一段bandizip的帮助说明:

UTF-8是用于存储Unicode的标准字符编码方法,其被开发用于显示各种语言。
由于Unicode和UTF-8是在20世纪90年代之后开发的,因此ZIP格式的初始版本(在20世纪80年代制造)不支持UTF-8。 由于ZIP格式成为标准档案格式并且需要支持Unicode,因此,已经引入了几种方法来处理ZIP文件上的UTF-8字符串。
Bandizip支持其中两种;一种方法是将文件名转换为UTF-8,另一种方法是将额外的UTF-8文件名存储在额外的头字段中,同时将原始文件存储在MBCS中。
在Zip文件中使用Unicode文件名(UTF-8)
Bandizip将文件名存储在ZIP文件中,并将其转换为UTF-8。 它是由APPNOTE定义的标准文件名存储方法,但是一些压缩程序偶尔无法识别ZIP文件或错误处理它们将导致文件名损坏。
将Unicode文件名存储在Zip文件的额外头字段中(UTF-8)
Bandizip将附加UTF-8文件名存储在ZIP格式的额外头字段中,同时将原始文件存储在MBCS中。 此方法也由APPNOTE定义为“Info-ZIP Unicode Path Extra Field(ZIP信息U码路径额外字段)”。 因为它使用额外字段来存储UTF-8文件名,所以文件大小将比前者大几十字节。 但是,原始文件名存储在MBCS中,因此文件更安全,更兼容。
由于大多数压缩程序(如7zip,Winrar和Winzip)都支持此功能,因此可以防止文件名在使用不同系统语言的操作系统中被破坏。

Unicode filenames in ZIP format

简单点说就是zip支持Unicode有两种方式,第一种方式是直接把文件名从本地代码转换成UTF8存储在zip文件中,第二种方式是依然在zip文件中存储本地文件名代码,然後把本地文件名代码转换成UTF8存储在ZIP文件的额外头字段中。第一种方式有可能会出现兼容性问题,第二种方式因为存储的还是本地文件名代码,所以绝对不会出现兼容性问题,但是这样就相当于把文件名存了两次,所以文件会大一些。

大家猜猜,好压、WinRAR、WinZip,以及加了cu参数的7-Zip分別支持哪一种Unicode存储方式?

实测好压支持的是第一种。

上面我用好压制作了一个「新建文本文档.zip」,裡面内容就是一个名为「新建文本文档.txt」的空文档,我用notepad++打开是这个样子的:

一堆乱码,注意那个「金區板缓XXXXX.txt」其实就是「新建文本文档.txt」的乱码。

选择UTF8编码。

正确的文件名就出来了。

我再把这个名为「新建文本文档.txt」的空文档用WinRAR压缩成zip格式,用notepad++打开:

注意前面是正确的文件名「新建文本文档.txt」,後面是乱码。

选择UTF8编码。

前面变成乱码,後面显示正确的文件名「新建文本文档.txt」。

这个用WinRAR制作的文件比先前用好压制作的文件大了48个字节。

这就是第二种方式,实测WinZip用的也是这种方式。

至于7-Zip,它用的是跟好压一样的第一种方式。

我们理一下思路:

zip文件有三种方式,第一种支持Unicode兼容性一般,第二种支持Unicode兼容性好但体积最大,第三种不支持Unicode体积最小。

好压使用的是第一种方式,WinRAR和WinZip使用的是第二种方式。7-Zip默认第三种方式,加入cu参数後是第一种,不支持第二种。

实际上像WinRAR和WinZip这种国际性大公司才是最在乎兼容性的,自由软件开發者我感觉都不太在乎兼容性。


9月30日更新:

说说bandizip这个软件。

安装之後右键菜单会多出来一个「新建文件夹」选项。

然後是传说中的压缩包预览功能。

發现问题所在了吗?bandizip佔的位置太大了,好压和WinRAR都只佔了四五行,bandizip一个软件就佔了十几行,挤得右键菜单都显示不全了。

按道理说,如果我想知道压缩包裡有什么,直接双击打开不就可以了吗?所以我给压缩包预览功能的评价是负分。

还有那个自动解压功能。压缩包裡面有个A文件夹,A文件夹裡面有个B文件,换別的软件解压出来都是A文件夹裡面有个B文件,而bandizip解压出来直接就是B文件,我还得自己建个文件夹把B文件放进去。

总之,许多bandizip吹爆的特性,反而给我造成了困扰。而去掉这些特性,bandizip就不剩什么了。

而且我认为bandizip的界面很「简陋」,这裡说明一下,我所谓的「简陋」意思可能和別人不太一样。

来对比一下。这是bandizip的压缩界面:

这是好压的压缩界面:

bandizip只有一个压缩时间。好压则是压缩时间、压缩速度、压缩率、文件个数什么都有。这就是我所谓的「简陋」,即功能上的「简陋」。

再来看看好压的配置界面,可以自定义压缩算法、字典大小、单词大小。以这个配置压缩解压需要多少内存直接给你标出来。7-Zip也不过如此了吧。

还可以编辑过滤列表,对不同後缀名的文件采用不同的压缩配置。

这就是为什么我宁愿使用有广告的好压,也不用干净清洁小巧的bandizip。


2019年10月1日更新:

刚才测试了一下Win7自带的explorer.exe对zip文件的支持情况,结论如下。

explorer压缩zip文件不支持Unicode,但是可以打开Unicode文件名的zip文件,实测好压和WinRAR压缩的zip文件都可以打开。

explorer只支持deflate和deflate64两种压缩算法,不支持其他压缩算法。

2019年10月2日更新:

感觉好像歪楼了,题目问的是为什么RAR 比 7Z 更流行。我总结一下,7-Zip相比于RAR至少有三大缺点:

⒈界面简陋

⒉压缩耗时高,佔用内存多(在有的人眼中这是优势)

⒊稳定性差,压缩包容易损坏

第三点不是我说的,我给大家摘一段bandizip对7z格式的评价(链接):

为了实现更高的压缩比,7z使用了包括报头压缩在内的各种方式。
但是,由于这些功能,当压缩文件受到轻微损坏时,几乎不可能恢复它。
因此,在以7z格式备份重要文件时,请注意不要损坏它们。
您可以在7Z网站上找到有关如何恢复损坏的7Z文件的信息,但即使对专家来说,完成恢复也是极其困难的。

有人说这是商业软件的刻意抹黑,我给大家转一段开源界大佬对7z的评价(链接):

The [LZMA2 format] contains an unrestricted mix of LZMA packets and uncompressed data packets. Each packet starts with a header that is not protected by any check sequence in spite of containing the type and size of the following data. Therefore, every bit flip in a LZMA2 header causes either a framing error or a desynchronization of the decoder. In any case it is usually not possible to decode the remaining data in the block or even to know what failed. Compare this with [Deflate] which at least does protect the length field of its non-compressed blocks. (Deflate's compressed blocks do not have a length field).

这段文字是什么意思呢?我简单解释一下,LZMA2是7z的默认压缩算法,用这种算法压缩文件会产生这么一种情况:

假如一个普通文件内容是「ABCDEFG」,然後它第二个字节损坏了,我们看到的就是「A?CDEFG」。但如果这是一个使用了LZMA2算法的7z压缩包,我们看到的就是「A??????」。

Therefore, every bit flip in a LZMA2 header causes either a framing error or a desynchronization of the decoder. In any case it is usually not possible to decode the remaining data in the block or even to know what failed.翻译:因此,在LZMA2报头中的每个位翻转都会引起解码器的帧错误或者同步失调。在所有情况下,通常都不可能解码块中的剩余数据,甚至都不知道哪裡错了

最後,这位大佬给出的建议是:不要用LZMA2算法储存重要文件。

也就是说,如果你坚持使用7z格式,那么你就祈祷吧,祈祷压缩包裡一个字节错误都不要有。因为只要出现一个字节错误,整个压缩包就废了。

所以,即使不考虑时间因素,rar相比于7z仍然是有优势的。


2019年10月4日更新:

今天评论区还有人对我说:你说的不对,zip格式不支持Unicode。唉……

说个可能会违反大家常识的事:一般人可能会认为7-Zip这种免费软件靠的是口碑,WinRAR这种商业软件靠的是宣传。

错!

真实的情况是:WinRAR靠的是口碑,而7-Zip靠的是宣传

我印象中从来沒见过WinRAR做广告宣传过它自己。WinRAR崛起靠的是它良好的口碑带动人民群众用脚投它的票。

7-Zip並不是缺乏宣传推广,而是它的宣传推广已经过头了。过头到什么程度?明明是7-Zip自己的zip格式不支持Unicode,现在好多人以为全世界的zip格式都不支持Unicode。7-Zip的bug已经快变成feature了

我试过很多压缩软件,只有7-Zip的zip格式默认不支持Unicode。其他不支持Unicode的软件,我都能在他们的安装目录裡找到7z.dll,这些软件都是直接把7-Zip的东西拿过来用,都不带改的。

有人说什么国外都用7z,于是就有了这么一个有趣的问题:(为什么 Linux 要用 tar.gz,很少用 7Z 或 ZIP)?作为一个自由软件,7z连它的大本营linux都沒有搞定

还有人说什么国外注重版权,都不用rar。我给大家看一张英文维基百科的截图:

英文维基百科对rar的评价是:second in popularity to .zip files.人家对7z可沒有这么高的评价。

类似的还有bandizip,有人做宣传说bandizip支持Unicode,而WinZip和WinRAR都不支持?

我發现,像7-Zip和bandizip这种免费软件,其官网还是比较靠谱的,基本沒什么虚假宣传。但是其免费的特征,会招来一群人帮他们做免费宣传。然後这群人中的大部分啥都不懂,但是想象力很丰富,会自动脑补出一些並不存在的东西。比方说他们看到7-Zip宣传自己的7z格式支持Unicode,就会自动脑补成zip格式不支持Unicode;他们看到bandizip宣传自己的zip格式支持Unicode,就会自动脑补成別家的zip格式不支持Unicode。明明bandizip的大标题是「ZIP格式的Unicode文件名」,正文说的是「我们和WinZip、WinRAR一样都支持Unicode」,这些人连点进去看一眼正文的想法都沒有。

然後这些人对他们宣传的东西有一种谜之自信。有人说7z格式易损坏,马上就会有人跳出来说你有什么证据?沒有人会把自己的缺点放在官网上宣传,然後这群人的逻辑是:7z不说它有这个缺点,那么它就沒有这个缺点,你这样造谣污蔑肯定是收了钱的。

为什么我说7z易损坏的时候要引用那么多资料呢?因为我害怕被人喷。


10月6日更新:

我记得我已经把这个评论踩下去了。怎么又被顶上来了?

这个评论存在事实错误。因为我用的都是默认配置,7z的默认配置是16M字典大小:

WinRAR的默认配置是是32M字典大小:

居然还有43个赞,可见7z的虚假宣传多么严重了。

市场永不失效。——这是我学了经济学之後最大的收获。

一提起市场失效,大部分都会想到德沃夏克键盘和QWERTY键盘的故事。我学经济学之前也认为这是一个市场失效的典型案例。但是後来我知道了三点我以前不知道的东西:

⒈德沃夏克键盘是有专利的,每一个使用德沃夏克键盘的人都要给德沃夏克交专利费,而QWERTY键盘免费。

⒉所有德沃夏克键盘优于QWERTY键盘的实验,都是德沃夏克自己搞的,他是在推销自己的产品,所以其实验的真实性值得怀疑。

⒊德沃夏克键盘並不完美,比如说现代英语中I的使用频率远高于U,但是德沃夏克键盘把U放在了比I更顺手的位置上。

我觉得第一点就能把这个问题下的大多数人劝退了。

有人说什么WinRAR的流行靠的是盗版软件,装机的人都装WinRAR,用户沒有选择权。

问题来了:为什么装机的人都装WinRAR呢?还不是因为它好用!

这就好比说Windows为什么流行?因为国内电脑都预装盗版Windows,用户沒有选择权。

我才不会告诉你们当年我的笔记本电脑上预装的就是Linux,我回家第一件事就是把Linux格了,换个盗版Windows装上去。

如果装机的人选择7-Zip而不是WinRAR,最大的可能不是用户从WinRAR迁移到7-Zip,而是他这个电脑卖不出去了。

目前的现状是:Windows平台上最流行的压缩格式是zip,其次是rar(rar是第二流行的压缩格式这种观点是英文维基百科说的)。

Linux平台上最流行的压缩格式是tar.gz,其次是tar.bz2。

zip用的是deflate算法,tar.gz用的也是deflate算法,其实就相当于换了个後缀名。tar.bz2用的是bzip2算法,rar用的是私有压缩算法。

这三种压缩格式中,综合考虑压缩率、压缩时间、稳定性等等因素,rar是最好的,但是它收费,所以屈居老二,zip排第一,这很合理,很符合市场规律。

现在好多人吹捧7z的同时都要把zip踩一下,这真是令人无语的操作。很多人都不知道,其实zip也是开源格式。现在压缩界的龙头老大,是被一个开源格式牢牢掌控着的,这个格式就是zip。我平时压东西用的也是zip。

7z三大缺点,一丑二慢三不稳定。按理说第一个缺点是最不重要的,为什么人们常常提起的反而是第一个缺点呢?

这是因为「丑」这个缺点,是一眼就能够看见的,不容抵赖。後两个缺点不是长年累月地使用是不会發现的。

我以前也用7-Zip,7-Zip的zip格式默认不支持Unicode文件名这种坑点我是亲身实践發现的。像WinRAR这种商业软件,人人得而诛之,它一旦出现什么问题就会被人挑出来指着鼻子骂;而7-Zip这种免费软件,推销的人都会或多或少地美化它。WinRAR名面上有很多坑,但是我们知道它就只有这么多坑,而7-Zip看似完美的表象下你根本不知道它有多少坑。


2019年10月9日更新:

自v7.0开始,Bandizip会发布3种版本

标准版:为大众提供的免费的版本
专业版:为专业用户提供的付费版本
企业版:为企业用户提供的付费版本

自7.0开始,Bandizip将会在软件中加入广告,强制更新,並且不再提供离线安装包。希望广大Bandizip爱好者届时能继续支持这个软件,呵呵。


2019年11月3日更新:

有人说字典大小不同不能比较,那我来一个字典大小相同的比较实验:

zip用32K字典,rar和7z都用1M字典,使用的测试材料是中文小说,结论如下。

压缩耗时比:

zip标准:RAR标准:7z快速:7z标准=1:2.5:4.8:9

最终文件大小的比例是:

zip标准:RAR标准:7z快速:7z标准=120%:1:107%:93%

bandizip很鸡贼,他的「正常压缩」使用的是7-Zip「快速压缩」的参数,他的「最大压缩」使用的是7-Zip「标准压缩」的参数。所以使用bandizip压7z的时候,我们会發现他的压缩速度比较快,但是压缩比不高。


2021年10月10日更新:

「7-Zip 现在会为 UTF-8 编码的文件名写入额外的字段至 zip 压缩包中。

这可以让 zip 压缩包在不同系统中提取时能得到正确的文件名。」

7-Zip终于加入Unicode支持了,版本号是21.02 alpha,更新时间是2021年5月6日。

标准zip加入Unicode文件名的时间是2006年。时隔15年之後,7-zip终于支持这个标准了,真是不容易。

另外bandizip所谓的「高速压缩」实测是假的,宣传口径而已。




  

相关话题

  腾讯是否已经放弃TIM了? 
  这样一个数据库分析软件需难度高吗? 
  为什么录音软件中的电平为负值? 
  IT 人能在一线城市里生活一辈子吗? 
  为什么有些高级程序员宁愿在国内 35 岁被辞退,也不愿意去国外工作? 
  有哪些好用却不为人知的 PC 端国产软件? 
  据报道称“浏览器内核有上千万行代码”,浏览器内核真的很复杂吗? 
  有没有什么软件可以依据人耳的等响曲线来修正不同响度下音乐的频响,从而使听感保持一致? 
  CS专业工资那么高为什么大家不都去学CS? 
  如何看待「Office 2003 够用了,不用 Office 2013」之类的言论? 

前一个讨论
为什么日本动漫机动战士高达系列的试验机在作战表现上碾压量产机?
下一个讨论
为什么直到现在 RAR 仍然比 7Z 更流行?





© 2024-11-05 - tinynew.org. All Rights Reserved.
© 2024-11-05 - tinynew.org. 保留所有权利