你不知道的哪些关于数据存储的知识

来源: 云巴巴 2022-11-22 11:05:58

 

    本篇文章主要谈一下MySQLHBaseES这几种数据存储的主要知识。

    MySQL,关系型数据库。主要面向OLTP,支持事务,支持二级索引。支持sql,支持主从、Group Replication架构模型。

    HBase是基于HDFS,支持海量数据读写,尤其是写。支持上亿行、上百万列的,面向列的分布式NoSql数据库,天然分布式,主从架构,不支持事务,不支持二级索引,不支持sql

    ES是一款分布式的全文检索框架,虽然ES也提供存储,检索功能,但我一直不认为ES是一款数据库,底层基于Lucene实现。但是随着ES功能越来越强大,与数据库的界限也越来越模糊,天然分布式,p2p架构,不支持事务,采用倒排索引提供全文检索。

    MySQL采用行存储,HBase是面向列的NoSql数据库,解释了行、列存储的区别。至于ES,我也说不清楚它是什么存储方式,暂且叫它索引存储吧。

    MySQL中要提前定义表结构,数据以行为单位组织在一起的,假如某一行的某一列没有数据,也需要占用存储空间;也就是说表共有多少列(属性)需要提前定义好,并且同时需要定义好每个列所占用的存储空间。

    HBase则是以列为单位存储数据,每一列就是一个key-valueHBase的表列(属性)不用提前定义。列可以动态扩展,比如人员信息表中需要添加一个新的“address”字段,MySQL需要提前alter表,HBase的话直接插入即可。

    ES比较灵活,索引中的field类型可以提前定义。也可以不定义,如果不定义,会有一个默认类型,不过出于可控性考虑,关键字段最好提前定义好。

    MySQL依然会为该字段保留空间,因为后续有可能会有update语句来更新该记录,补上sex内容;简单的展示了数据在MySQLHBase中存储差异,和真实的情况还有差距,可以看到即使第二条记录的sex字段为空,而HBase则是把每一列都看做是一条记录,row+列名作为keydata作为value,依次存放。假如某一行的某一个列没有数据,则直接跳过该列。对于稀疏矩阵的大表,HBase能节省空间。

    说完MySQLHBase,这里要重点说一下ESES的存储方式和上面两个都不一样,MySQLHBase是将数据按不同的方式进行存储。好歹它们存的还是数据,而ES则存的是倒排索引。

版权声明:本文为Yun88网的原创文章,转载请附上原文出处链接及本声明。

 

更多产品了解

欢迎扫码加入云巴巴企业数字化交流服务群

产品交流、问题咨询、专业测评

都在这里!

 

评论列表

为你推荐

云服务器中数据的存储对于用户使用而言也很重要

云服务器中数据的存储对于用户使用而言也很重要

云服务器是我们存储并且计算信息的主要依据,云服务器已经成为了我们存储信息时主要的一个选择。对于企业而言想要让企业所有的信息全部存在U盘上并不太可能,而这些信息如果不能存储在云服务器中则难免会造成信息泄漏的现象发生。如果说数据计算是云服务器的主要工作,那么把

2022-11-24 10:14:39

容器数据存储当前发展及未来前景浅析 | SmartX 趋势分享

容器数据存储当前发展及未来前景浅析 | SmartX 趋势分享

“SmartX 趋势分享”由 SmartX 团队内部分享的权威机构市场报告、全球重要媒体文章精选整理而成。内容涉及现代数据中心相关产业趋势以及金融、医疗、制造等行业全球用户需求与实践前沿洞察。无论您是客户、合作伙伴还是分析师,欢迎您在后台提出您关注的话题或

2022-11-22 09:32:31

海量数据存储的表结构优化是什么样的

海量数据存储的表结构优化是什么样的

现在,无论是工作还是学习,都要使用网络,海量数据存储系统是网络系统的升级版,海量数据存储可以有效解决目前面临四大安全威胁。要建立一个完善的海量数据存储防护管理体系,必须从客户端软件、邮件服务器端安全、安全邮件信息服务提供商等各个企业方面可以采取一些相应的技

2022-11-21 10:34:48

数据存储的逻辑卷和文件系统是什么

数据存储的逻辑卷和文件系统是什么

提起数据存储的话,如果你还不知道逻辑卷和文件系统是什么,那可是万万不行的。 为了方便管理,我们也可以将多个物理块设备,组合成一个容量更大的逻辑块设备,也可以将硬盘这样的物理块设备,分割成多个逻辑块设备。 底层的相关技术和工具,包括RAID(大家可能比较

2022-11-22 11:07:01

新一代的数据存储技术到底有多强大?

新一代的数据存储技术到底有多强大?

云存储是目前发展最为迅猛,远远超过了其他大数据应用的发展速度,必将是未来数据应用的重要组成部分。另外,数据分层、数据存储、融合以及智能也将逐渐普及应用,可以说,安防行业为满足大数据的到来,已经做足了准备。

2022-11-22 16:06:07

针对海量数据和高并发的主要解决方案

针对海量数据和高并发的主要解决方案

正是科技使我们的这个地球变小,现在的我们已经不再满足于物质的享受,更多的则是精神上的安逸,人类在探索与发明的同时,人们在享受科技如数字化安全的带来的福祉的同时也收获了快乐。本文,就对于海量数据存储进行了简要相关的的介绍。 海量数据存储的海量数据的解决方案

2022-11-21 10:34:58

严选云产品

甄零科技一诺业财法一体化合同管理系统 甄零科技一诺业财法一体化合同管理系统,CLM助推企业走向合同的电子化、数字化和智能化,帮助企业向管理要效益。灵活、高效、多样的合同创建方式,基于端到端业务流程,发现效率的堵塞点,OCR、智能审查等工具是提升拟定效率的关键,流程拉通、系统集成是提升履行效率的关键。
东智格创机台远程监控管理系统RCM 东智格创机台远程监控管理系统RCM,为构筑无人化、自动化、智能化体系,解决操作设备的人多、操作效率低、不及时、对无尘环境影响大的痛点,需要对产线内所有设备应用综合远程控制系统。通过远程综合监控及控制,实现人力配置最佳化,提高设备稼动率,降低不良品、降低Particle污染。
美团餐饮系统 美团餐饮系统全面对接外卖平台,自动接单减少丢单和漏单,自动分发订单并打印,降低员工工作量,提升出餐速度。统一外卖菜品库存管理,实时监测各渠道销量,备货补货更精准。 统一外卖报表,降低财务人员工作量,财务准确性更高。
云短信 云短信是创世云为用户提供的一种通信服务的能力,支持快速发送短信验证码、短信通知等,服务范围覆盖全球200+国家/地区。三网合一专属通道,与工信部携号转网平台实时互联。电信级运维保障,实时监控自动切换,国内短信秒级到达,到达率高达99%
阿里云负载均衡SLB 阿里云负载均衡是云原生时代应用高可用的基本要素。通过对多台云服务器进行均衡的流量分发调度,消除单点故障提升应用系统的可靠性与吞吐力。阿里云SLB包含面向4层(TCP/UDP)的传统型负载均衡CLB和面向7层(HTTP/HTTPS/QUIC)的应用型负载均衡ALB,是阿里云官方云原生网关。
视界云VIPSpeed跨境电商网络服务平台 视界云VIPSpeed跨境电商网络服务平台为跨境电商提供高速、稳定的全球网络连接服务。它通过智能路由优化、数据加速技术,确保跨境交易流畅无阻。平台支持多店铺管理,集成物流跟踪、数据分析等功能,助力商家提升运营效率,优化客户购物体验,加速跨境电商业务的全球拓展。

甄选10000+数字化产品 为您免费使用

申请试用