首页

作为一个K-V数据库，levelDB索引为什么要使用LSM树实现，而不采用哈希索引？第1页

1

guodongxiaren 网友的相关建议:

DDIA第三章写的很清楚了，建议楼主读一读。

Hash有个问题就是在内存里能高效存取，但是在磁盘上不行。这就是为什么关系型数据库要用B树做索引了。因为索引结构是要持久化在磁盘上的。

磁盘这个硬件和内存不同，对随机访问的支持很弱。需要寻道等等。

图片来源网络

题主只考虑了，通过一个key来查其value的情况。但如果是范围遍历。key在hash结构中并不有序。Hash就很难满足了。

这一点来看Hash做磁盘索引结构是不明智的。

另外我觉得用LSM直接和Hash来做比较是不太合适的。因为LSM、B树这种都是稍高维度的数据结构。LSM和B树还有的比较。因为LSM不仅描述了结构，还描述了更新读写的各个策略，并且它其实不是一种数据结构，而是三个小结构的组合（磁盘上顺序追加写入的log+内存有序MemTable+磁盘上有序SSTable）。

hash则是更为基础的一种思想，就比如用下面的LSM的图来说。Memtable和SStable的存储的KV，不也是Hash么？

图片来源网络

LSM当然有局限，LevelDB适用于写多读少的场景，并且写操作实际是追加型的写入，而不是随机写。也就是同一个key，写入多次。其实会存储多份。占用空间会多些。

对于读极端情况下，确实比较慢。因为可能要一层一层的向下遍历。但整体来说内存中的MemTable和磁盘上的SSTable都是有序的了。

没有一种数据结构是万能的，关键还是看场景。一切都是Trade-Off。

另外就是要多关注一下硬件的部分。我们印象中学习的数据结构都是大都是内存场景的，换个环境很多结论都不成立。

作为一个K-V数据库，levelDB索引为什么要使用LSM树实现，而不采用哈希索引？的其他答案点击这里

1

相关话题

  根据某网站统计，重名前五位的人，大部分都是 80 后，这是为什么？
  如何评价TiDB？
  为什么像会计等非it行业处理数据要用excel而不是sql？
  NoSql是一种语言，还是一种概念？
  数据库的冗余度是不是越小越好？
  很多网站源码都是分为 GBK 和 UTF-8 版，为什么要同时开发两种？
  人工智能的水平较低是因为数据库不足和运算处理速度不够吗？
  鹿晗关晓彤公开恋情，是如何把新浪微博的服务器搞垮的？
  加盐hash，为什么叫“Salt（盐）”而不叫“Sugar（糖）”或其他？
  如何建立公司财务分析数据库及财务分析模型？

前一个讨论

如何把战锤40k做成一个电影宇宙？

下一个讨论

同样是大国，为什么美国是分布式电网，而中国不是？

相关的话题

  想去一间公司工作，老板说要我学会数据库和大数据课程，然后通过考试就可以去了，但是也没说清楚啥课程？
  怎么实现一个简单的数据库系统？
  Python/Pandas如何处理百亿行，数十列的数据？
  为什么新的分布式数据库又开始支持关系模型了？
  为什么 JS 不能绕过后端代码直接调数据库，有哪些后端处理的逻辑，JS 不能写？
  C# 为何MySQL无法打开连接?
  如何理解关系型数据库的常见设计范式？
  如何评价snowflake这家公司，发展前景如何？
  假如有人把支付宝所有存储服务器炸了（物理炸），大众在支付宝里的钱是不是就都没有了呢？
  为什么几乎所有的开源数据库中间件都是国内公司开源的？并且几乎都停止了更新？
  怎样理解分析王垠文章《SQL，NoSQL 以及数据库的实质》的观点？
  人工智能的水平较低是因为数据库不足和运算处理速度不够吗？
  MySQL已经可以干大部分事情了，还有必要使用商业数据库或者PostgreSQL吗？
  如何评价StarRocks开源？
  为什么新的分布式数据库又开始支持关系模型了？
  数据库预编译为何能防止SQL注入？
  数据分析人员需要掌握sql到什么程度？
  如何学习 SQL 语言？
  两个文件的 MD5、SHA1 同时碰撞的概率有多大？
  有哪些分布式数据库书籍或论文比较好？
  Cache 和 Buffer 都是缓存，主要区别是什么？
  想去一间公司工作，老板说要我学会数据库和大数据课程，然后通过考试就可以去了，但是也没说清楚啥课程？
  能否构造一个含有自己哈希或MD5等的文件？
  为什么很多公司都开始去 Oracle 而使用 MySQL？
  硬盘写到一半断电时文件系统发生了什么？
  什么样的数据库设计才是优秀的？
  为什么国内流行hbase，国外反而多用cassandra？
  SQLite 的读写效率很高，有哪些使用其他数据库的理由？
  想去一间公司工作，老板说要我学会数据库和大数据课程，然后通过考试就可以去了，但是也没说清楚啥课程？
  用户和管理员同时操作同一记录的不同字段，如果做并发控制？

© 2025-06-01 - tinynew.org. All Rights Reserved.
© 2025-06-01 - tinynew.org. 保留所有权利