这会儿正好在rebuild chromium,机器卡到不行。看到这个问题有感来回答一下。
其他童鞋对于“浏览器内核真的很复杂”这个复杂的一面,已经回答的很的多了,但我想从“复杂”和“没那么复杂”两个方面都来讲讲,给大家提供一些别的思路和参考。
(如果觉得前文太长,也可以直接跳到最后看吐槽)
先说复杂。其他回答基本都是用chromium来举例的。我们来看chromium,这货确实相当相当的复杂。源码拉下来就有十多G。我们不禁好奇,chromium到底有哪些玩意,为啥平时感觉只是显示个网页、几句HTML而已,怎么会需要这么多代码。
第一眼从目录结构上,chromium包含这些东西:
看起来还好吧?但实际上,这里面每一个展开来讲,都是一本厚厚的工具书的容量。
比如net,看起来只是个网络库,然而里面包含主机解析,cookies,网络改变探测,SSL,资源缓存,ftp,HTTP, OCSP实现,代理 (SOCKS和HTTP) 配置,解析,脚本获取(包括各种不同系统下实现),QUIC,socket池,SPDY,WebSockets……里面每一项展开来讲,就是一本书。
v8层,看起来功能很单一,只是实现一下js嘛,但里面包括字节码解析器,JIT 编译器,多代GC,inspector (调试支持),内存和 CPU 的 profiler(性能统计),WebAssembly 支持,两种 post-mortem diagnostics 的支持,启动快照,代码缓存、代码热点分析……里面每一项展开来讲,又是一本书,还是难坑的编译原理和优化方向。
Skia,看起来只是个图形库嘛,用点画出各种图。然而里面包括十几种矢量的绘制,文字绘制、GPU加速、矢量的指令录制以及回放(还要能支持线程安全)、各种图像格式的编解码、PDF的生成(这个是个隐藏的很深的功能,但很有趣。Skia支持把矢量图绘制成pdf)、GPU渲染优化(既以上部分功能需要用gpu来渲染)……里面每项展开来讲,又是一本书。另外值得一提的是,skia是谷歌收购的。不知道谷歌是觉得自己没实力做,还是太费功夫。总之谷歌选择了直接买别人的代码来完成这些功能。
ui,看起来只是一套UI 框架嘛。然而chromium需要一套全平台适配的ui库,还要能支持gpu加速。不过可惜的是里面没实现richedit。ui库的设计,深入来做,其实可以说又是个浏览器了。
等一下,以上这些,看起来只是浏览器的外层。我们最关心的网页排版呢?这个难道不是浏览器的核心嘛。是的,神奇的是,chromium把排版引擎blink放到了third_party下,而且架构上真的当成了一个第三方库一样对待。据谷歌的员工说,这是历史原因……好吧姑且信了。然而这个第三方库,成了当之无愧的最复杂,功能最重要的第三方库。
blink的工作包括:
说起来简单。看一下现在的HTML、CSS规范,各种细节加起来……有快上万页。除了chromium layout组、firefox的开发人员等,我想没几个人会去仔细阅读并一个个的实现这些规范吧。光是看目录和文字描述,就头大了,更别说要完整的实现出来。往往一个简单的display:girdflex背后就是庞大复杂的计算,而且还要充分考虑性能上如何优化,滚动时如何更快的展示…
另外排版还需要支持世界各国的奇奇怪怪的文字。例如从右往左写、规则复杂无比阿拉伯文。相比之下,汉字这种方块字的排版简直就是弟弟。还有各种奇怪的unicode字符。
怎么能处理好这些字符和语言,并配合几千页的html、css排版规则正确显示出来……这是个极度烧脑的事情。
我们再从排版这个大泥坑里跳出来看看外面别的东西。这时候你会发现……外面的泥坑好像更大。
随便说几个,比如:
其他的点还有很多很多,以后想到了再补充。总之,以上随意一个点,要正确的实现,都是一个团队的工作量,都可以写成一本书。然而chromium把他们全部实现了,而且还在不停的加入新的功能。
看到这里,大家应该明白为啥强如微软,也放弃维护他们自己的浏览器内核了。因为需要投入的人力财力实在是太恐怖了。chromium团队,光是开发人员,都已经上千了。假如每个人员年薪是100w 人民币,持续投入十年,这个支出就是几十亿,这还不算周边的测试、产品、UI。最关键的是,就算微软愿意投入十亿,能保证做到chromium相同的功能吗?就算能做到相同的功能,还不是另外一套chromium,能做出其他优势吗?于是最后微软也放弃了,干脆直接从开源的chromium上改起,把微软需要的功能融入chromium。
所以,chromium的霸权就是这么来的。看似开源免费,实则把所有开发者和对手,紧紧的捆绑在自己周围。
好了,现在吐槽开始了。
chromium称霸浏览器界以来,看起来开源,谁都可以拿去改。然而比起它的前辈,我觉得从“道德”上,chromium要“差”很多。最让我受不了的一点是,chromium在无尽的往里面塞功能的时候,很少想过是否别人可以轻易的移除它们。chromium代码号称模块化、高内聚低耦合,然而如果你想砍掉一些不需要的东西,对不起,没有宏控制,手动删代码吧。有几个人能有精力一点点的去掉里面这些繁琐的功能呢?这就导致一个问题,需要chromium某一部分功能的人,必须被强塞进一堆谷歌认为你需要的东西。
对比之下,为啥我说比起chromium的前辈要差很多呢,其实我指的正是webkit。webkit最让人欣赏的一点就是它在专注实现内核的同时,大部分功能都是可“拆卸”的。有宏可以关闭。甚至连svg这种排版上的小功能都有宏可以关闭。而chromium,如果我需要排版、音视频,但不需要多进程呢?如果我需要音视频但不需要webrtc呢?对不起,谷歌没这考虑。要带就全都带上吧,不带你自己砍代码吧。等你辛苦几个星期砍完代码,谷歌告诉你,我都更新了2、3个版本啦,你要不要更新下代码?哦?新版本chromium架构又大改了?哭了……
这也就造成现在基于chromium的一堆开发框架,如electron、cef、nwjs,全都动不动100多M的大小。因为从chromium的框架设计上,就很难把那些极其庞大复杂的细节功能排除掉。这些功能对于谷歌作为一个浏览器来说,当然是必要的。然而回到本问题,“浏览器内核”真的需要这么复杂吗?浏览器需要这么复杂,这是真的;然而作为一个浏览器内核提供给一些sdk给别人用,也需要这么复杂吗?我们用electron写一套进供销管理系统的客户端,你会需要带上几十M的webrtc、webgl、多媒体播放、天城文支持吗?
最后打破这个疑问的,是我很多年后进入了QQ浏览器的移动端组(其实就是x5内核,微信上被大家吐槽最多的那个)。当年的x5内核其实是基于webkit改造的。从chromium回到webkit,我突然有种豁然开朗的感觉。
回到问题开头,从浏览器内核的角度,其实没那么复杂,只要做好网络、排版、渲染,就足以应付大部分使用场景了。
这让我想起浏览器早期年代,群雄争霸的时代,那时候浏览器内核很小。从几百K到几M的浏览器都有。我记得早年的移动设备上跑的浏览器,css支持的都不好,不过特别小巧,有的才几百K而已。
然而后来组里架构调整,x5内核为了跟上时代,从webkit切回了chromium(也是因为被骂了太多了,当时x5号称移动端IE6,做过微信相关开发的人应该深有体会)。对chromium深恶痛绝的我,当时有了一个大胆的想法。把排版引擎blink(也就是webkit在chromium里的继承者)重新从chromium里剥离出来,再补上一些周边的设施、组件,再次成为一个完整独立的浏览器内核。
当然我还是有自知之明的。一个浏览器内核而已,不可能实现chromium同样的功能。但能把排版、渲染、网络、视频实现,就差不多了。其实我也不是想做个浏览器,而是想专注内核这块,做一个提供给第三方app嵌入的内核。
作为一个内核,其实不需要上面讲的所有那一大堆功能。比如,网络层,大部分人不需要什么网络改变探测,ftp,OCSP实现,代理配置、解析、脚本获取,QUIC,socket池,SPDY什么的。大部分人仅仅需要一个http的实现,可以拉取到服务器资源。我用300k的curl代替了十余M的chromium net库,并工作良好。少了的功能可以用插件形式补上嘛。一些和排版渲染无关的功能,我都打算做成插件。例如音视频、webgl、webrtc、多进程等。
目前这个项目已经撸了5年了,开源在github上,提供C接口方便其他语言调用。整个编译出来就是一个1-20m左右的dll(视编译选项而定),甚至还包含了一个electron的精简实现:
欢迎围观。
真的很复杂!
工作第三年的时候,我就觉得自己编程水平天下无敌,完爆大多数人。
直到我看见了Google Chromium的开源代码。。。
2010年加入创业时期的360,担任高级工程师,负责一个远控软件,同时要跟操作系统底层打交道,入职不久直属Leader就被调整,我开始带团队。
带团队不久之后,开始狂妄自大、目中无人,自以为老子天下第一,谁都看不上。
幸好,这时候遇到了一位在论坛上结识的C++高手,彼时他在百度担任某部门技术Leader。我和他聊天过程中,他感受到了我的自大和浅薄。
到今天还记得和他的对话:你是不是以为自己已经很牛逼了?去看看全世界最牛的代码吧,别在你的小圈子里和其他人比。
我回复:看什么??
他说:去看看Google Chromium吧。
我还真就开始学习Google Chromium了,初看时,真是有一种始惊、次醉、终狂的感觉。
Chromium的每一个子系统拿出来都无比复杂,你想真正看懂就需要大量的计算机体系基础知识。
这张架构图基本展现了以上模块的关联关系:
想看懂如chromium这样的顶尖开源代码,多看计算机经典书籍是必须的,不然一旦陷入到一个不明白的知识点,整个学习的过程全部卡死。
我把大学和工作中用的经典电子书库(包含数据结构、操作系统、C++/C、网络经典、前端编程经典、Java相关、程序员认知、职场发展)、面试找工作的资料汇总都打包放在这了,这套资源可不是一般那种网上找的资源,是伴随我从学生一路成长为腾讯高级开发工程师,360技术经理、360技术总监的打包全套,非常宝贵!点击下方链接直达获取:
我已经帮大家打包好了,点击下方链接直接获取:
说一个学习Chrome源代码的诀窍:Chrome的源码不要只看不上手,编译起来运行起来,多改改看看会发生什么。这个过程即好玩又能加深你对源码的理解。
真是不比不知道,一比吓一跳,有的时候,我们真的是处于愚昧山峰。
除了Google Chrome的源码,还可以多看看Google的其他开源代码,你会被震撼、被打击、被陶醉!同时,你也会知道,自己写代码究竟是个什么水平!
Google的所有开源代码在这,感兴趣的朋友可以看看:
包括了:Android、Angular、Chromium、Dart、DeepMind Lab、Flutter、Gerrit、Go、Istio、gRPC、Kubernetes、Polymer、Ptotobuf、TensorFlow、V8、WebRTC。
本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度,google,bing,sogou 等
© 2025 tinynews.org All Rights Reserved. 百科问答小站 版权所有