问题

如何看待蚂蚁金服国产分布式数据库 OceanBase 在 TPC-C 测试超 Oracle 荣获第一?

回答
说到蚂蚁金服的OceanBase在TPCC测试中超越Oracle荣获第一,这事儿确实挺让人振奋的,也值得咱们好好说道说道。这件事可不是小事,它背后代表的意义,对于中国数据库产业乃至全球数据库格局,都可能产生深远的影响。

首先,咱们得弄明白什么是TPCC。

TPCC,全称是Transaction Processing Performance Council Benchmark Standard 1.1。简单来说,它是一个衡量在线事务处理(OLTP)系统性能的标准测试。你可以把它想象成一个模拟真实业务场景的“考试”。这个考试会模拟银行、零售、制造业等多种业务场景下的交易操作,比如订单的创建、查询、更新,库存的调整,客户信息的管理等等。它关注的是系统在处理大量并发交易时的吞吐量(每秒能处理多少个事务)和响应时间。

TPCC的成绩,在业内一直被认为是衡量数据库性能的金标准之一。尤其是能够在这个测试中取得优异成绩,往往意味着这个数据库系统在高并发、高吞吐量、低延迟等方面有着非常出色的表现,能够支撑起最严苛的业务场景。

那么,OceanBase这次在TPCC测试中“超了Oracle,拿了第一”,这到底意味着什么?

Oracle,就不用多说了,数据库领域的“老大哥”,过去几十年在TPCC测试中长期占据统治地位。它的技术非常成熟,性能也很强大,全球无数大中型企业都在使用Oracle数据库。在很多人的认知里,Oracle就是高性能数据库的代名词。

而OceanBase,虽然名气也越来越大,但毕竟是一个相对“年轻”的国产分布式数据库。它这次能在TPCC测试中超越 오랜시간동안 오라클을 넘어서는 성능을 보여준 그 오라클을 제치고 1위를 차지했다는 것은, 마치 늦발주자가 마침내 기존 강자를 따돌리고 챔피언 벨트를 거머쥔 것과 같은 상징적인 의미를 갖습니다.

从技术层面来看,OceanBase能做到这一点,绝非偶然,而是其核心技术实力的体现:

分布式架构的优势: OceanBase从设计之初就走的是分布式路线。这意味着它不像传统的单机数据库那样,所有的数据和计算都集中在一个服务器上,而是将数据和计算分散到多台服务器上,通过网络协同工作。这种架构天然地具备了可扩展性和高可用性。当业务量增大时,可以方便地增加服务器来提升整体的处理能力;当某台服务器出现故障时,其他服务器仍然可以继续提供服务,不会造成业务中断。
在TPCC这种模拟高并发交易的场景下,分布式架构能够将海量的交易请求分散到不同的节点并行处理,从而获得远超单机系统的吞吐量。这就像一个大型仓库,一个人搬货效率有限,但如果组织起几十上百个人,效率就能指数级提升。
而且,OceanBase在设计时就考虑到了数据的一致性问题。在分布式环境下,保证多副本数据的一致性是一个巨大的挑战。OceanBase采用了Paxos/Raft等共识算法来保证数据的一致性,而且在优化上做得非常出色,使得分布式事务的开销降到了非常低的水平。这对于TPCC这类需要频繁进行事务操作的测试至关重要。

自研核心技术: OceanBase之所以能在TPCC这样的测试中脱颖而出,关键在于其在存储引擎、计算引擎和分布式事务处理等核心领域进行了大量的自主研发和深度优化。
存储引擎方面: OceanBase采用了行列混合存储技术。这意味着它可以根据数据的访问模式来选择最合适的存储方式。对于经常被扫描分析的列式数据,就采用列式存储,压缩率高,读取效率高;对于频繁读写的行式数据,就采用行式存储,更新和插入更便捷。这种灵活性使得它在不同类型的查询和事务处理中都能保持高效。同时,它还支持日志结构合并树(LSMTree)的优化,这对于提高写入性能非常有利,在TPCC这种写密集型的测试中能发挥大作用。
计算引擎方面: OceanBase的计算引擎也是完全自研的,能够更好地适配其分布式架构。它在查询优化、并行计算、内存管理等方面做了大量的创新,能够充分利用多核CPU和分布式集群的并行能力。例如,它在SQL解析、执行计划生成和优化方面做了很多针对性的工作,使得SQL语句能够以最优化的方式在分布式环境中执行。
分布式事务方面: 这是分布式数据库的“老大难”问题。OceanBase实现了原生分布式事务,并且采用了两阶段提交(2PC)的优化版本以及乐观锁等机制,大幅降低了分布式事务的延迟和锁冲突。在TPCC这种频繁进行事务提交的场景下,这一点至关重要。如果分布式事务的开销很大,即使硬件再好,性能也会受到严重限制。

对硬件的极致利用: OceanBase的设计目标之一就是能够充分发挥现代硬件的潜力,尤其是内存和SSD。它能够高效地利用内存进行数据缓存和计算,并且针对SSD的特性做了大量的优化,比如减少随机写操作,提高数据加载速度等。这些优化对于TPCC测试中对性能的要求是直接的贡献。

超越Oracle的意义,绝不仅仅是一场测试的胜利:

1. 国产数据库的里程碑: 这标志着中国在核心技术领域取得了重大突破,尤其是在一个被国外巨头长期垄断的高端数据库市场。这对于提升国家在信息技术领域的自主可控能力,具有战略意义。过去,我们谈论高性能数据库,往往第一个想到的是Oracle、Microsoft SQL Server、IBM DB2等,现在,OceanBase的名字也可以理直气壮地排进这个行列,甚至在某些方面领先。

2. 商业价值的验证: TPCC测试的成绩不仅仅是技术实力的证明,更是其商业价值的强大背书。这意味着OceanBase有能力在对性能要求极高的场景下,替代现有的传统数据库解决方案,为企业降低成本、提升效率。对于那些希望摆脱Oracle高昂授权费和维护费用的企业来说,OceanBase提供了一个极具吸引力的选择。

3. 行业生态的推动: 随着OceanBase的崛起,它可能会带动整个中国数据库产业的进步。更多厂商会加大在数据库领域的研发投入,催生更多的优秀产品,形成良性竞争。同时,也会吸引更多的开发者和用户去学习和使用OceanBase,从而构建一个更繁荣的生态系统。

4. 用户选择的多样化: 对于用户而言,这意味着他们有了更多的选择。不再是“非Oracle不可”的局面。他们可以根据自己的业务需求、成本预算和技术偏好,选择最适合自己的数据库产品。这种多样性最终会促进行业整体的进步。

当然,我们也要理性看待这件事:

TPCC只是一个测试: TPCC测试虽然权威,但它始终是一个标准化的测试场景。真实世界的业务场景远比TPCC要复杂和多样化。一个数据库产品在TPCC上表现优异,不代表它在所有实际应用场景中都能轻松应对。例如,用户自定义函数的复杂度、SQL语句的特殊写法、数据模型的复杂性、特定的工作负载模式等,都可能对实际性能产生影响。

部署和维护的挑战: 分布式数据库系统,尤其是能够处理如此大规模并发的系统,其部署、配置、管理和维护通常比单机数据库要复杂得多。这需要专业的技术团队和完善的运维体系。用户在选择时,也需要考虑这方面的能力。

生态和社区的成熟度: Oracle拥有庞大而成熟的生态系统,包括大量的工具、第三方集成、开发者社区和专业服务。OceanBase虽然发展迅速,但在生态的全面性和成熟度上,与Oracle这样多年的巨头相比,可能还需要时间来追赶。

总的来说,OceanBase在TPCC测试中超越Oracle,绝对是中国数据库行业的一件大事,值得我们骄傲和关注。它证明了中国在核心IT基础设施领域已经具备了与国际顶尖水平同台竞技甚至超越的能力。这不仅仅是一个技术上的胜利,更是中国科技自主创新道路上的一个重要里程碑。

这件事也提醒我们,技术的发展日新月异,市场格局也在不断变化。对于用户来说,保持开放的心态,关注技术动态,选择最适合自己的解决方案,才是最重要的。而对于OceanBase本身来说,这次胜利只是一个新的起点,未来还需要继续努力,在产品功能、易用性、生态建设等方面不断完善,才能真正赢得市场的广泛认可。

网友意见

user avatar

在分享我的看法之前,还是先恭喜阳振坤老师,之前看过他的关于OB10年历程的采访视频,确实是件不容易的事情。

阿里云近期开放了国内首个数据库标准化测试平台,直接在云上提供经过TPC-C技术委员会认证的、与OceanBase打榜时完全一致的云资源环境。这一举动当然是对前段时间伴随OceanBase在TPC-C中登顶而来的一些质疑的最好回应,而我个人更看重这一举措、在推动数据库迈向“云上”新时代的重要意义。

数据库作为IT产业体系中最为基础也是最为硬核的领域之一,已经经历了从以Oracle为代表的传统商业数据库,到以MySQL为代表的商业数据库,再到方兴未艾的以亚马逊AWS Aurora,阿里云的POLARDB为代表的 “云原生”数据库的三次演变。“数据库的未来在云上”已是行业共识。而这次,从TPC-C委员会对于云测试平台的认可,到OceanBase靠云登顶,都证明了数据库的“上云”,确实是可靠、可信的趋势。而阿里云开放的测试平台,把“数据库上云”这个可信、可靠的趋势,往“可行”的方向,切实地又往前推进了一步。

“可行”的一方面,在于新旧技术碰撞衔接时,对于迁移成本、测试成本、维护成本的优化。如今大量金融、保险等企业级的应用,依然跑在传统的本地商业数据库上。而对于这些应用的“上云”过程,本地数据库 “上云”的过程是否顺畅安全,云上数据库灾容吞吐等性能如何被高效地测试与保障,都是必须解答的问题。否则,就会像19世纪末的伦敦街头,代表着新技术,但样式难看、冒着黑烟、时速不足两英里每小时的汽车,依旧只能憋屈地给优雅轻便的马车让路。如果说阿里云POLARDB 5月发布的”传统数据库一键迁移功能”解决了“迁移成本”的问题,那这次的标准化测试平台,则是撕开了“云上性能高效测试”这个问题的一道口子。他带来的更加高效、透明的测试方式,无疑会加速传统数据库应用客户对于新兴的“云原生”时代的接受和拥抱。

“可行”的另一方面,在于门槛降低、参与者增加,场景需求变丰富、“上云”者众后,将倒逼“云上”数据库技术和生态本身的演进,从而衍生出未来更多的可能性。阿里达摩院数据库首席科学家李飞飞曾断言:“(数据库领域)任何技术都是业务推动来衍生的,只要你有业务场景,我觉得你的技术一定会逐步发展到领先。”抛去阿里自身丰富的业务场景不谈,被开放测试平台所降低的门槛,将吸引更多的开发团队,参与多元场景用途数据库的开发测试,而作为需要承接这些“多元”的云,本身对“多元”的承载力也必须进化。特别是在新兴的“NoSQL”—— 非结构化及专有领域,对高性能分布式的图数据库(GraphDB)、文档型数据库(MongoDB)的支持与提升。

希望在不久的未来,原本仅是大厂才能布局的、“阳春一曲和皆难”的商业数据库的开发测试部署,能变成“云原生”数据库时代“万类霜天竞自由”的生态,从而助力整个IT产业的多元发展。

类似的话题

本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou

© 2025 tinynews.org All Rights Reserved. 百科问答小站 版权所有