当前位置:首页 > 网络黑客 > 正文内容

大数据通俗解释(生活中的大数据10个例子)

访客3年前 (2021-09-21)网络黑客607

大数据不仅是大量的数据,在其他方面也有一定的特点。

第一,大数据的数据量非常大,传统的单机存储系统已经不能存储这么大的数据量。这时候就需要分布式存储技术。

第二,大数据中的数据种类繁多,数据的格式会变得复杂,比如视频、文档、图片、消息记录等等。

第三,大数据中隐藏着一个非常重要的价值。通过数据分析技术,智能、数字化地支持业务决策。

大数据的主要作用是为公司上层提供商业决策支持,让公司结合历史数据,向正确的方向发展。大数据技术主要分为两大类:大数据计算和大数据存储。

大数据计算主要分为离线计算和实时计算。具体使用取决于业务场景对数据输出延迟的要求

离线计算对于数据输出会有一定的时间延迟,可以是15分钟,也可以是几小时,也可以是几天。离线任务一般是对数据进行全局批量计算,这次就完成了。与实时计算不同,除非您自己停止实时任务,否则实时程序将始终运行。

实时计算数据是不断生成的,数据输出的延迟通常很低,最多几秒钟。比如我们的大数据屏,实时数据流处理等。,这些场景对数据输出延迟的要求很低。

离线计算,一般对数据输出延迟没有那么高的要求,只要最后输出数据,具体使用很多公司的离线业务报表。目前大部分公司的离线计算引擎都是使用Hive或者Spark,而实时计算引擎主要是Flink。

大数据存储需要分布式数据存储,单台机器无法存储这么多海量数据

在传统的关系数据库中,当一个表非常大的时候,会利用数据库和表的技术将它分布存储在不同的机器上。开源工具TDDL可以用于数据库和表分离技术。

在非关系型NoSQL数据库中,可以选择HDFS作为最低的文件存储系统。HDFS文件系统以块的形式存储文件,一个块的大小为128兆字节,每个块将存储三个副本,这样数据就可以以容灾的方式存储。即使一个数据块损坏,也可以选择其他数据块进行数据恢复。

分布式数据库系统可以横向和纵向划分数据表。例如,在HBase数据库中,区域用于水平分区,列族用于垂直分区。

分布式数据存储技术需要不同的机器协同工作,每台机器存储整个数据的一个子集。在未来的大数据时代,分布式数据存储和分布式数据库肯定会被使用,这将成为大数据系统的标准。

我是Lake,专注于大数据技术原理,人工智能,数据库技术,程序员经验分享。如果我的问答对你有帮助,希望你能夸奖我,关注我。谢谢你。

扫描二维码推送至手机访问。

版权声明:本文由黑客接单发布,如需转载请注明出处。

本文链接:http://therlest.com/78697.html

分享给朋友:

“大数据通俗解释(生活中的大数据10个例子)” 的相关文章

淘宝什么时候发货(淘宝一般都是什么时候发货)

随着12月的到来,“双12推广”也如约而至。作为2020年电商最后一次推广,三天爆发也需要提前布局。 1双十二赛马规则 过去双十一促销,很多商家说没有达到预期,甚至很多免费流量也没有改变。问题的关键其实在于赛马规则。大推广前会有额外的赛马规则分配免费流量。想要在推广期获得更确定性的流量,必须了解...

【干货知识】高級不断渗透第八季-demo就是远程控制

本季度是《高級不断渗透-第七季demo的发展》的持续。 点一下文尾左下角“阅读”可阅读文章第七季文章正文。 在第一季有关后门中,文章内容提及再次编译程序notepad ,来引入有目标源代码后门结构。 在第六季有关后门中,文章内容假定不在获知notepad 的源代码,来引入无目标源代码沟...

安宫牛黄丸图片及价格(同仁堂安宫丸价钱13万

动物研究显示,体外培育牛黄;还有个绿色锦盒包装的用的是人工麝香。 730点00安宫牛黄丸的药理作用主要表现为抗惊厥作用及解热作用。想给家里老人备一些,天然牛黄,并且只有北京同仁堂生产的安宫牛黄丸,同仁堂安宫牛黄丸会员价,因为主药)原料不同,北京同仁堂牛黄解毒丸的市场价格在2005年4月30,才可以安...

奥迪a三报价及图片大全,奥迪a3最新价格及图片

主要是看配置和相应4s点的一些降价幅度。2010款奥迪A3Sportback1点,市场需求等诸方因素的影响而有所调整。 每个地区优惠不一样,2010款,A3报价如下最新2016款Sportback35TFSI进取型18点49万,你好,车价不用说了就是发票价格;购置税约等于发票价格除以11点7;交强险...

茯苓多少钱一克贵吗 - 土茯苓和茯苓哪个贵

因为很难挖到。茯苓2点5-3点5元一两,2016年1月4日更新。 30元左右一斤,还有以后.药店的销售价格通常在20,价格更高些,我在这边收购,2011年茯苓价格分两种价格,也就是两种产品,心;脾;肺;肾经。也和并不容易挖到。 4]渗湿利水;健脾和胃;宁心安神。即使在茯苓产地的山里面,茯苓价格悄悄地...

如厕阅读-如厕时读书看报有哪些坏处?

如厕阅读-如厕时读书看报有哪些坏处? 读书、看报兼如厕,不少人有这样的习惯。然而这一习惯非常不好。蹲厕时读书看报,会干扰大脑对排便传导神经的指挥,延长排便时间。现代医学研究证实,蹲厕超过3分钟即可直接导致直肠静脉曲张淤血,易诱发痔疮,且病情的轻重与时间长短有关。蹲厕时间越长,发病几率越高。因为久蹲...

评论列表

泪灼本萝
2年前 (2022-06-05)

值。通过数据分析技术,智能、数字化地支持业务决策。大数据的主要作用是为公司上层提供商业决策支持,让公司结合历史数据,向正确的方向发展。大数据技术主要分为两大类:大数据计算和大数据存储。大数据计算主要分为离线计算和实时计算。具体使用取决于业务场景对数据输出延迟的要求离线计算对于

发表评论

访客

◎欢迎参与讨论,请在这里发表您的看法和观点。