当前位置:首页 > 网络黑客 > 正文内容

大数据通俗解释(生活中的大数据10个例子)

访客3年前 (2021-09-21)网络黑客621

大数据不仅是大量的数据,在其他方面也有一定的特点。

第一,大数据的数据量非常大,传统的单机存储系统已经不能存储这么大的数据量。这时候就需要分布式存储技术。

第二,大数据中的数据种类繁多,数据的格式会变得复杂,比如视频、文档、图片、消息记录等等。

第三,大数据中隐藏着一个非常重要的价值。通过数据分析技术,智能、数字化地支持业务决策。

大数据的主要作用是为公司上层提供商业决策支持,让公司结合历史数据,向正确的方向发展。大数据技术主要分为两大类:大数据计算和大数据存储。

大数据计算主要分为离线计算和实时计算。具体使用取决于业务场景对数据输出延迟的要求

离线计算对于数据输出会有一定的时间延迟,可以是15分钟,也可以是几小时,也可以是几天。离线任务一般是对数据进行全局批量计算,这次就完成了。与实时计算不同,除非您自己停止实时任务,否则实时程序将始终运行。

实时计算数据是不断生成的,数据输出的延迟通常很低,最多几秒钟。比如我们的大数据屏,实时数据流处理等。,这些场景对数据输出延迟的要求很低。

离线计算,一般对数据输出延迟没有那么高的要求,只要最后输出数据,具体使用很多公司的离线业务报表。目前大部分公司的离线计算引擎都是使用Hive或者Spark,而实时计算引擎主要是Flink。

大数据存储需要分布式数据存储,单台机器无法存储这么多海量数据

在传统的关系数据库中,当一个表非常大的时候,会利用数据库和表的技术将它分布存储在不同的机器上。开源工具TDDL可以用于数据库和表分离技术。

在非关系型NoSQL数据库中,可以选择HDFS作为最低的文件存储系统。HDFS文件系统以块的形式存储文件,一个块的大小为128兆字节,每个块将存储三个副本,这样数据就可以以容灾的方式存储。即使一个数据块损坏,也可以选择其他数据块进行数据恢复。

分布式数据库系统可以横向和纵向划分数据表。例如,在HBase数据库中,区域用于水平分区,列族用于垂直分区。

分布式数据存储技术需要不同的机器协同工作,每台机器存储整个数据的一个子集。在未来的大数据时代,分布式数据存储和分布式数据库肯定会被使用,这将成为大数据系统的标准。

我是Lake,专注于大数据技术原理,人工智能,数据库技术,程序员经验分享。如果我的问答对你有帮助,希望你能夸奖我,关注我。谢谢你。

扫描二维码推送至手机访问。

版权声明:本文由黑客接单发布,如需转载请注明出处。

本文链接:https://therlest.com/78697.html

分享给朋友:

“大数据通俗解释(生活中的大数据10个例子)” 的相关文章

淘宝什么时候发货(淘宝一般都是什么时候发货)

随着12月的到来,“双12推广”也如约而至。作为2020年电商最后一次推广,三天爆发也需要提前布局。 1双十二赛马规则 过去双十一促销,很多商家说没有达到预期,甚至很多免费流量也没有改变。问题的关键其实在于赛马规则。大推广前会有额外的赛马规则分配免费流量。想要在推广期获得更确定性的流量,必须了解...

【干货知识】高級不断渗透第八季-demo就是远程控制

本季度是《高級不断渗透-第七季demo的发展》的持续。 点一下文尾左下角“阅读”可阅读文章第七季文章正文。 在第一季有关后门中,文章内容提及再次编译程序notepad ,来引入有目标源代码后门结构。 在第六季有关后门中,文章内容假定不在获知notepad 的源代码,来引入无目标源代码沟...

为什么反复烧开的水会有毒?

为什么反复烧开的水会有毒? 千滚水就是在炉上沸腾了一夜或很长时间的水,还有电热水器中反复煮沸的水。这种水因煮过久,水中不挥发性物质,如钙、镁等重金属成分和亚硝酸盐因浓缩后含量很高。久饮这种水,会干扰人的胃肠功能,出现暂时腹泻、腹胀;有毒的亚硝酸盐还会造成机体缺氧,严重者会昏迷惊厥,甚至死亡。 蒸...

种植土茯苓亩产多少斤(2020年广东土茯苓收购价格)

茯苓菌种每亩需要1800-2000袋,茯苓价格悄悄地涨了一点点,价格相对来说也是广东比较高的?笔者愿以此文与商家药农探讨,土茯苓的块茎分为赤白两种。 多生于山坡或林下。生活的。常年经销户,在亳州,统计中得到印证:安徽亳州:年销量6000吨以上。主要是零售。每年收一次。 主要是看品种,2005亩产-2...

崔鹏(足球)个人资料简介(简历及图片)

崔鹏(足球)人物概况 本页面提供了崔鹏(足球)个人资料简介(简历及图片),崔鹏(足球)是谁?崔鹏(足球)个人简介资料完整设计了网页求职找工作编辑个人简历作品所需要的崔鹏(足球)网站常用模板元素,不保证崔鹏(足球)人物数据真实,任何问题请联系管理员调整。 崔鹏(足球)图片 崔鹏(足球)个人资料简...

不锈钢水箱制作厂家(小型家用储水箱不锈钢

福瑞达不锈钢水箱厂,产品外形美观,不锈钢水箱按用途可以分为生活水箱和,采用进口食品级304不锈钢材料制作而成,农村,宝汇不锈钢水箱,比较满意,金诚铭不锈钢水箱,比较满意,现在对生活水箱不是很清楚的了解. 有很多的水箱,安装快,含镍量、生产基地位于江西省南昌英雄城。1-9000T水箱都能定做。 此类水...

评论列表

泪灼本萝
3年前 (2022-06-05)

值。通过数据分析技术,智能、数字化地支持业务决策。大数据的主要作用是为公司上层提供商业决策支持,让公司结合历史数据,向正确的方向发展。大数据技术主要分为两大类:大数据计算和大数据存储。大数据计算主要分为离线计算和实时计算。具体使用取决于业务场景对数据输出延迟的要求离线计算对于

发表评论

访客

◎欢迎参与讨论,请在这里发表您的看法和观点。