百科问答小站 logo
百科问答小站 font logo



2021年,分布式系统在研究什么,有哪些未解决的前沿问题? 第1页

  

user avatar   lin-jin-he 网友的相关建议: 
      

学术界的我不太了解,简单说说我看到的工业界正在做的事情。(想到哪,写到哪,如有错漏欢迎评论~)

Cloud-Native

经过几年的高速发展,云计算现在已经深入人心了。但是,上云不仅仅是将物理机换成云上的虚拟机。更重要的是,软件要根据云环境的特点重新设计和实现,这样才能充分发挥云环境的优势。

现在进行得如火如荼的,就是基础软件,特别是数据库的云原生化。

翻翻最近几年的 SIGMOD、VLDB 的论文目录就可以知道,各大云巨头输出了不少这方面的论文。

第一个比较成功的云原生数据库案例,应该是 Amazon Aurora?它之前发表了两篇论文,有兴趣可以读一下:

  • Amazon Aurora: Design Considerations for HighThroughput Cloud-Native Relational Databases
  • Amazon Aurora: On Avoiding Distributed Consensus for I/Os,Commits, and Membership Changes


之后,阿里云也推出了同类的产品 PolarDB,也发了不少相关论文,比如:

  • POLARDB Meets Computational Storage:Efficiently Support Analytical Workloads in Cloud-Native Relational Database
  • PolarFS: An Ultra-low Latency and Failure ResilientDistributed File System for Shared Storage Cloud Database
  • Cloud-Native Database Systems at Alibaba: Opportunitiesand Challenges
  • 在今年的 SIGMOD 2021 上,还发表了一篇:PolarDB Serverless: A Cloud Native Database for Disaggregated Data Centers


腾讯云也推出类似的云原生数据库 TDSQL-C…

Aurora、PolarDB 和 TDSQL-C 这类云数据库,我们一般称之为 shared-storage 架构。它们的存储层挂的是一个大“网盘”——分布式文件系统、对象存储等。

云上还有一类分布式数据库架构,一般称之为 shared-nothing 架构。比较著名的是 Google 的 Cloud Spanner。不过,Cloud Spanner 技术上很牛叉,商业上却被 Aurora 碾压,毕竟性价比不够高。Shared-nothing 架构好几个开源的数据库,比如 TiDB、CockroachDB、YugabyteDB,它们也在朝云上进军。

  • Spanner: Google’s Globally Distributed Database
  • Spanner: Becoming a SQL System
  • TiDB: A Raft-based HTAP Database
  • CockroachDB: The Resilient Geo-DistributedSQL Database

前面讲的这些,都是偏 OLTP 的 Cloud-Native Database(TiDB 其实主打的 HTAP,下面再介绍)。Snowflake 是一家从云上诞生的公司,2020 年已经在纳斯达克上市,主要业务是 Cloud-Native 的数据仓库,充分利用了云上的弹性伸缩能力。有兴趣也可以看看他们的论文:

  • The Snowflake Elastic Data Warehouse。

HTAP

传统的架构下,AP 和 TP 一般是两套异构系统。TP 系统是产生数据的源头。AP 系统需要定时从 TP 系统批量导入数据。

除了需要付出维护两套系统的成本外,最让人头疼的是两套系统之间的数据延迟。

为了降低运维、运营成本,同时提升 TP 请求和 AP 请求的数据一致性,越来越多的系统都在向 HTAP 方向演进。

国内最初宣布支持 HTAP 的数据库,应该就是 TiDB 了,可以看看他们的论文:

  • TiDB: A Raft-based HTAP Database。

Google 内部的 F1,经过多次演进,也向 HTAP 靠拢了:

  • F1 Lightning: HTAP as a Service。

TiDB 和 F1 都是从 TP 其家,然后向 AP 靠拢实现 HTAP。也有一些系统是从 AP 开始,后来逐渐加入 TP 的能力,比如:

  • Greenplum: A Hybrid Database for Transactional and Analytical Workloads。

最近,蚂蚁的 OceanBase 又出来打榜,上次打的是 TPCC,这次大的是 TPCH,以此来对外宣布自己也走上了 HTAP 之路。

ML for System

以前都是 System for ML。现在开始 ML for System。

我第一次听说机器学习为数据库服务的例子是 Google 的一篇论文:The Case for Learned Index Structures

ML for System 现在最流行的应该是数据库系统的 Self-Deriving。这一块目前做得比较有名的是 CMU 的 OtterTune

CMU 的数据库大牛 Andy Pavlo 已经自己开公司做这一块的工作了,公司名就叫 OTTERTUNE


user avatar   niu-zi-ang 网友的相关建议: 
      

想要了解最新前沿的问题,当然最好的渠道之一就是阅读分布式系统的最新论文。UIUC CS525课程提供了一份论文参考书目,目录包含了将近 70+ 篇分布式系统的论文,而且都是最近两年的。

最后借用Indranil Gupta教授的话:What a great time to work in Distributed Systems!


user avatar   banfoxianren 网友的相关建议: 
      

不知道效果如何,坦率的说,挺难的。如果真出来了,我打算支持一台,和爱国无关,纯粹的护犊子心理。当然这个行为跟华为无关,只是我个人这么想,华为当然也不在乎我怎么想,自己的钱想怎么花就怎么花,改革开放这么些年,能在国际市场叱咤风云就这么几个,我觉得华为做的挺好,就这些。。。。。。。


user avatar   tan-xin-yu-22 网友的相关建议: 
      

怎么没人提《圣斗士星矢》啊?

这个系列作品的特色不就是回回都是一部的戏就半天时间么?

黄道十二宫篇:纱织中了天箭座的箭,必须12小时内突破圣域十二宫。

北欧篇:奥丁代言者希露达被海皇戒指蛊惑令冰川融化,纱织代替希露达阻止冰川融化但是只能坚持12小时,必须在时限内摘下希露达的戒指。

海皇篇:纱织代替人类承受波塞冬的洪水,应该也是只能支撑一天之内的时间。

冥王十二宫篇:被哈迪斯复活的圣斗士要在12小时内取下雅典娜的首级,实际目的则是为了雅典娜去冥界并且唤醒女神圣衣,12小时候被复活的圣斗士们就消失了。

冥界篇:记不清打了多长时间,但从纱织被塞到缸里抽血开始到解决应该也是一天之内。

黄金魂:在本篇剧情里有好几天,但对应到冥界篇时间仅仅发生在冥界篇12黄金击破叹息之墙到打死神之间。

火星篇:马尔斯获得阿丽娅的权杖后建立起巴别塔吸引火星,会在12小时内毁灭地球,主角们必须在12小时内突破新十二宫。

土星篇:这篇好像打了很多天……




  

相关话题

  特斯拉法务部开通社交账号后发私信「警告」自媒体,如何看待这种行为? 
  iPhone为啥不用曲面屏? 
  计算机专业现在真的不吃香吗?为什么我身边的人都不让我报计算机专业? 
  为什么现在有那么多人帮特斯拉洗刹车失灵呢? 
  为什么在中国搞不出 Spark 和 Hadoop 这种东西? 
  如何看待腾讯部分部门试点每周1天强制 6 点下班? 
  为什么在中国搞不出 Spark 和 Hadoop 这种东西? 
  为什么华为6月2日鸿蒙发布会没上知乎热搜? 
  2021 年 6 月 30 日发布的小米笔记本 Pro X15,售价 7999 元起,值得购买吗? 
  现在985机械电子工程专业研一快结束,想转java或者ic验证工程师,不知道这两个方向如何选择? 

前一个讨论
为什么玩 LOL 久了玩其他游戏都索然无味?
下一个讨论
如何看待四川「格聂之眼」景区修栈道引热议,官方已叫停修建,立即恢复植被,还有哪些细节值得关注?





© 2024-05-17 - tinynew.org. All Rights Reserved.
© 2024-05-17 - tinynew.org. 保留所有权利