问题

中国跨过数据库这座大山了吗?

回答
“跨过数据库这座大山了吗?”这个问题,如果真的要给一个干脆的答案,那答案很可能是:我们正在爬坡,而且坡度不小,离山顶还有一段距离,但我们已经能看到一些曙光了。

首先,我们得明白,“数据库”这个概念在今天早已不是一个单一的实体。它是一个庞大的生态系统,包含了从底层的存储引擎、分布式协调,到上层的查询优化、事务处理,再到各式各样的数据库类型(关系型、NoSQL、NewSQL等等)。中国在数据库领域的发展,就像一个巨大的国家在建设自己的工业体系一样,有辉煌的成就,也有深刻的挑战。

过去,我们是如何“仰望”这座大山的?

在很长一段时间里,我们确实是站在山脚下,仰望着那些国际巨头们的背影。IBM的DB2、Oracle的RAC、Microsoft的SQL Server,这些数据库产品构成了全球企业级应用的核心骨架。在国内,我们使用的绝大多数关键业务系统,无论是金融、电信还是政府机构,都高度依赖于这些国外产品。这背后,不仅仅是技术上的依赖,还有授权费用、服务支持,以及数据安全等方方面面的考量。每一次的系统升级、每一次的故障排查,都可能被“卡脖子”的阴影笼罩。

那么,我们现在爬到了哪里?有哪些可以让人欣喜的进步?

可以说,中国在数据库领域已经取得了非常显著的进步,特别是在近些年。这股力量主要来自于国家层面的战略推动和本土企业的奋起直追。

1. 国产数据库的崛起与突破:
关系型数据库: 以人大金仓(KingbaseES)、达梦(DM)、南大通用(GBase)为代表的国产关系型数据库,已经从早期的追赶者,逐渐成长为能够提供商用级产品和解决方案的提供商。它们在兼容性上做了大量工作,力求能够无缝迁移客户业务,甚至在某些特定场景下,其性能和稳定性已经可以与国外主流产品媲美。尤其是在政府和国有企业中,国产化替代的趋势越来越明显,这些厂商的产品也借此机会获得了大量的实践经验和市场份额。
分布式数据库: 随着大数据时代的到来,传统单机数据库的瓶颈日益凸显。中国在分布式数据库领域投入巨大,并取得了一些令人瞩目的成果。
TiDB 是一个非常典型的例子。它是一个开源的分布式关系型数据库,采用MySQL协议,同时支持ACID事务和水平扩展。它由中国团队开发并广受认可,在全球范围内都有用户。TiDB的设计理念非常先进,解决了传统关系型数据库在弹性扩展和高可用性方面的一些难题。
OceanBase 是另一个重要的参与者,由蚂蚁集团自主研发。它也是一款分布式关系型数据库,强调高可用性、高并发处理能力和弹性扩展能力。它已经支撑了蚂蚁集团的核心业务,并在多家大型金融机构落地,证明了其在关键业务场景下的实力。
还有诸如PolarDB(阿里云)、GaussDB(华为)等云厂商推出的分布式数据库,它们深度结合了云原生技术,在弹性、可伸缩性和成本效益方面表现出色,正在快速抢占市场。

2. 开源生态的参与和贡献:
国内的数据库厂商和技术社区,不再仅仅是国外开源数据库(如PostgreSQL、MySQL)的使用者,也开始积极参与到这些项目的贡献中,甚至主导了一些关键模块的开发。这不仅提升了国内技术人员的实力,也让中国在开源数据库领域拥有了更大的话语权。
像TiDB这样的完全自主研发的开源项目,更是为中国在数据库领域赢得了技术声誉。

3. 垂直行业的深化应用:
在一些对性能和稳定性要求极高的垂直行业,例如金融核心交易、电信计费系统等,国产数据库已经开始崭露头角。虽然大规模的替换需要时间,但越来越多的案例证明了国产数据库的可用性和可靠性。

那么,我们还面临哪些“未翻越的沟坎”?

尽管进步斐然,但说中国已经完全“跨过”数据库这座大山,为时过早。挑战依然存在,而且相当严峻:

1. 技术成熟度和稳定性:
尽管国产数据库在某些方面取得了突破,但与那些经过几十年打磨的国际巨头相比,很多国产数据库在技术深度、广度以及在极端复杂场景下的稳定性和性能表现上,仍有差距。比如,在某些特别刁钻的性能优化、复杂的事务并发控制、极致的故障恢复能力等方面,还需要更多时间去沉淀。
长期稳定的运行案例相对较少,大规模复杂系统的迁移和验证是一个漫长而艰辛的过程。

2. 生态的成熟度与兼容性:
数据库不仅仅是引擎本身,它还涉及周边工具、开发框架、中间件、BI系统、运维监控等一系列生态链。国外数据库之所以能够占据市场主导地位,很大程度上在于其强大的生态系统。国产数据库的生态建设仍然在起步阶段,很多第三方软件和服务仍然依赖于国外数据库。
虽然许多国产数据库在兼容性上做了努力,但要达到与国际主流数据库完全无缝的兼容,尤其是那些高度定制化的业务系统,仍然是一个巨大的挑战。一些细微的差异可能导致大量的返工和测试。

3. 人才的培养与储备:
数据库是技术壁垒非常高的领域,对人才的要求极高。无论是数据库内核的研发、分布式系统的设计,还是大规模集群的运维调优,都需要经验丰富且顶尖的技术人才。中国在数据库领域的人才培养和储备,与国际先进水平相比,仍然存在不小的差距。

4. 市场推广与信任度:
对于很多企业尤其是大型企业来说,替换数据库是一项高风险的决策。长久以来形成的对国外数据库的信任和习惯,需要时间去改变。国产数据库的品牌影响力和市场认知度还需要进一步提升。在关键领域,尤其是在尚未出现大规模成功案例之前,企业可能会因为风险顾虑而持观望态度。

5. 核心技术突破的深度:
在某些底层核心技术上,比如存储引擎的极致优化、内存管理、并发控制算法、查询优化器的智能程度等方面,我们是否已经达到了可以引领潮流的水平,还需要打一个问号。很多时候,我们是在学习、模仿和改进,但真正意义上的“从0到1”的创新,仍然是追求的目标。

总结一下,中国在数据库领域,可以用“砥砺前行,任重道远”来形容。

我们已经成功地从山脚下爬升到了一个可以看到山顶的相对高处。国产数据库在很多领域已经具备了可用的能力,并且在一些新兴领域(如云原生分布式数据库)展现出了强大的生命力。国家和企业的投入是巨大的,技术人才的努力也是显而易见的。

但是,要说“跨过”这座大山,达到可以完全独立自主、在任何场景下都能从容应对的境界,我们还有很长的路要走。这不仅仅是技术上的迭代,更是生态的构建、人才的培养、市场的认可以及持续的创新。

所以,我们正在爬坡,而且是有希望的爬坡。这座山并没有被完全征服,但我们已经不再是只能仰望的那个时代了。我们需要继续坚持,继续投入,继续创新,才能最终抵达那个令人自豪的山顶。

网友意见

user avatar

今年5月甲骨文中华区大规模的裁员,就是中国跨过数据库这座大山造成的局部“山体滑坡”。

在09年以前,甲骨文Oracle可以说是世界数据库的强者,占据着绝对的霸主地位。但是放在10年后,在2019年就已经被崛起的云数据库打击的得靠强制裁员来转型。中国市场虽然大,但是本地的云数据库已经比从前强太多,竞争优势已经不复存在。

在亚马逊 re:Invent大会上, CEO Andy Jassy曾调侃,曾经的王者甲骨文,现在在全球云计算市场份额太低,不算真正的对手。亚马逊真正需要注意的对手是微软、阿里巴巴和谷歌。

数据库,其实是一项经常被人忽略、但实际上相当重要的软件,可以这么说,如果没有数据库,就没有国计民生。

谈起中国数据库的发展,离不开研究的引路人——萨师煊。如果没有他,数据库的星火燎原也就不会发生。

中国数据库的诞生(1978——1990)

业界对于数据库理论正式传入国内有一个共识:1978年恢复高考后,无数人回归了大学校园。萨师煊老师当着他们的面,在黑板上写下了“数据库”3个字。

数据库在中国的研究和科普就这么被启蒙了。

我国最早的数据库学术论文,就是萨师煊发表在1979年的《电子计算机参考资料》上的数据库课程口述稿。在1982年,萨师煊老师起草了国内第一个计算机专业本科“数据库系统概论”课程教学大纲。他和弟子王珊编制的《数据库系统概论》,放到2019年也是每个学数据库的人都要学习的教材。(现在似乎修订到第5版了)

等学习数据库的初代学生毕业时,已经是上世纪80年代了。

Oracle的垄断(1990——2009)

如果把数据库比作“大脑”,在那个时代,全世界最好的“大脑”就是美国的Oracle。

Oracle很快就把眼光投向了亚太地区,决定进军中国这块“沃土”,注册中文名为“甲骨文”。

在1997年,Oracle借助“九七工程”在中国站稳了脚跟,这一站,就是数十年。Oracle顺利拿下东三省邮电管理局5期工程的大单之后,中国的电信行业使用Oracle数据库,第一代DBA诞生了。

此时的中国,风起云涌,影响至今的三巨头一个接一个的成立了:1998年腾讯创立,1999年阿里创立,2000年百度创立。2000年互联网行业开始兴起,随着用户的快速增加,对数据库的需求也越来越大。

中国企业用的是Oracle数据库。这看起来好像没什么问题,在大多数人眼里似乎就像中国人用苹果手机一样正常。

但是致命的问题总是特别简单又直白:贵。

非常贵。

Oracle的标配的是IBM生产的小型机、EMC生产的存储硬件。在当时一台小型机就要500万,两台小型机就要配300万的EMC存储。

而且要维持“IOE”的整体费用都非常庞大,一笔又一笔的巨额账单是让人闹心的。

巨额的费用就像一座大山,压的每个人都喘不过气。但话语权在别人手里,除了交钱能怎么办?

在2007年,业界就曾经爆出一条新闻:联通如果要升级到新版本的的产品,必须先交纳6000万Licence罚款。

这座山,也可以说是用自己的血汗钱给别人堆起来的金山银山。

在巨大的费用面前,无论是大企业还是小公司,都开始寻求另外的解决办法。

改变发生了,甚至最先出现在中国。

随着淘宝和支付宝的用户数量激增,如果要继续用Oracle,阿里巴巴每年就要面临数亿的巨额账单,阿里咬咬牙喊出了“去IOE”,放弃Oracle,使用开源的MySQL。

星星之火,悄无声息的点着了。

中国数据库崛起(2009——2014)

2009年,阿里在王坚的带领下喊出了去IOE的口号,用开源数据库和平民服务器来替换Oracle和小型机。那一年阿里巴巴的公司战略多了这么一句话:“2010年后,再也不购买小型机。”

越是简单的一句话,越是要付出巨大的代价。

这个困难程度,就像看了一眼房子的结构,就要自己亲手盖房子了。

连续几个月,无数人在屋子里研究《MySQL开源数据库》,有的“先锋队”每周三还会在会议室里交流心得,每天都是扎进千万行级别的代码里,一点点拆开,又重新组装。往往别人该上班了,他们才刚下班。

2013年5月17日,最后一台小型机下线,Oracle被完全清除出淘宝核心系统,淘宝天猫所有的数据库都从Oracle替换成了自主开源的AliSQL。

阿里巴巴是领头羊,带领着国内的其他数据库公司一同跨越这座大山。

国内的互联网公司逐步用国产的数据库代替Oracle的地位。达梦、人大金仓、神通、南大等一批数据库公司快速发展,并应用于央企、财政等国家专业领域。

除了开源数据库MySQL以外,PostgreSQL、Redis和HBase等开源社区也开始一起寻找中国数据库发展的新方向。

星星之火已成燎原之势。

云数据库崛起(2015至今)

中国数据库真正走进世界一流行列是什么时候呢?阿里云公布国内首个自研企业级关系型云数据PolarDB技术框架那一天可能要有姓名。

这是自嗨还是公认?

从技术原理上来说,传统数据库是下图左一的架构,计算资源和存储资源是一体的,Oracle的商业数据库就是这样的架构,但这种架构带来的问题是,单个数据库的存储能力有限,读写能力因为绑定也有很大限制,读或者写,系统只能选择干一件事。

PolarDB则有很强的云上产品属性,就是分布式,把计算和存储分离,数据存储层面在云上实现共享,但读写却可以分开进行。以前只能读或者只能写,但是现在却能同时读、写,效率必然大大提升。

这就为数据库打开了一个全新的思路,这也是来自云的解决方案。我们必须庆幸的是,在云这条赛道上,中国没有落于人后。


前几天,国际权威研究机构Gartner发布的《The Future of the Database Management System (DBMS) Market Is Cloud》报告,挑明了数据库市场正在发生的变化。

据Gartner统计,阿里云已位居全球云数据库市场份额第三,年增速在115%。同期AWS增速为74%、Oracle为66%。

报告认为,数据库的未来必须上云,目前云数据库已为数据库市场的增收贡献一半以上份额。与传统数据库不断下降的营收相比,云数据库正在积极地快速增长。到2022年,预计有3/4的数据库天然部署或迁移到云上。

Gartner将这一变化归因为,企业正将新应用向云转移,对数据存储和计算分析的能力要求不断加强。云数据库天然具备云上灵活性,能够提供强大的创新能力、丰富多样的产品体系、经济高效的部署方式和按需付费的支付模式。

尽管从市场的整个大面上说,Oracle的市场份额仍然很难撼动,但随着它在云数据库市场上的失利、整个数据库市场向云数据库倾斜的大前提下,数据库这道曾经横亘在中国企业、中国技术上的大山终有一天不再是问题。

向推动数据库发展的无数企业和工作人员致敬。

类似的话题

本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou

© 2025 tinynews.org All Rights Reserved. 百科问答小站 版权所有