多面体品牌营销致力于品牌的
网络化营销推广及数字化广告投放

大数据、数据挖掘、数据分析、数理统计之间的关联与差异

最近跟朋友聊到大数据相关的议题,才发现自己对于几个相关的名词都没有搞懂,就利用周末自己整理了一下,参考了网上许多专家的释疑文章,分享给有兴趣的伙伴朋友们作为参考!

定义:(来源:MBA数据百科)

大数据、数据挖掘、数据分析、数理统计之间的关联与差异

大数据、数据挖掘、数据分析、数理统计之间的关联与差异大数据、数据挖掘、数据分析、数理统计之间的关联与差异  数据挖掘是一种新的商业信息处理技术,其主要特点是对商业资料库中的大量业务数据进行抽取、转换、分析和其他模型化处理,从中提取辅助商业决策的关键性数据。

简而言之,数据挖掘其实是一类深层次的数据分析方法。数据分析本身已经有很多年的历史,只不过在过去数据收集和分析的目的是用于科学研究,另外,由于当时计算能力的限制,对大数据量进行分析的复杂数据分析方法受到很大限制。现在,由于各行业业务自动化的实现,商业领域产生了大量的业务数据,这些数据不再是为了分析的目的而收集的,而是由于纯机会的(Opportunistic)商业运作而产生。分析这些数据也不再是单纯为了研究的需要,更主要是为商业决策提供真正有价值的信息,进而获得利润。但所有企业面临的一个共同问题是:企业数据量非常大,而其中真正有价值的信息却很少,因此从大量的数据中经过深层分析,获得有利于商业运作、提高竞争力的信息,就像从矿石中淘金一样,数据挖掘也因此而得名。

因此,数据挖掘可以描述为:按企业既定业务目标,对大量的企业数据进行探索和分析,揭示隐藏的、未知的或验证已知的规律性,并进一步将其模型化的先进有效的方法。

大数据、数据挖掘、数据分析、数理统计之间的关联与差异

数理统计的概念与发展应该有近400年,其后很多应用领域不断增加,也是目前科学研究不可缺少的工具。数据分析是把一大批看来杂乱无章的数据中的信息集中、萃取和提炼出来,来找出内在规律,比较像是透过各种方法与工具来尝试解决问题的一个过程。数据挖掘其实是一种深层次的数据分析方法,由于近年计算能力的限制已经大范围的突破,可以对大数据量进行分析,而叫做挖掘是因为应用范畴已经跨出科研,往商业价值寻求探索,含金量也变高了。而大数据则就是对于现在大量数据的一个统称。

因此就数理统计与数据挖掘这两个都属于工具(方法)的部分再进行一个简单的关联性对比。

普遍的观点认为,数据挖掘是数理统计的延伸和发展。它们的很多方法在很多情况下都是同根同源的。例如,概率论和随机事件是统计学的核心理论之一,统计分析中的抽样估计需要应用该理论,而数据挖掘技术的朴素贝叶斯分类就是这些统计理论的发展和延伸。

但是两者之间的一些方法运用上还是会出现混淆,例如,主成分分析和回归分析。从严格定义上讲,这两种分析方法都属于数理统计分析方法,但在数据挖掘实战应用中也常常会用到这种方式,因此主成分分析和回归分析也是数据挖掘商业价值中常用的一种分析技术和数据处理技术。

二者之间也存在一些比较明显的差异

大数据、数据挖掘、数据分析、数理统计之间的关联与差异

虽然二者之间有同有异,但是在企业的应用中,不需要硬性地把两者区分开来,也没必要,不会有分析人员说:「我只用数据挖掘技术来分析」或者「我只用数理统计技术来分析」。

比较合适的构想与完善﷽﷽﷽﷽﷽﷽﷽﷽﷽﷽﷽﷽﷽﷽﷽﷽﷽往商業價值尋求探索,含金量也變高了﷽﷽﷽﷽﷽﷽﷽﷽﷽就更有效!﷽﷽﷽﷽﷽﷽﷽﷽﷽方法应该是:

分析具体的使用情境与决策需求,先确定分析思路,然后根据这个分析思路去挑选和匹配合适的分析算法、分析技术,而一个具体完善的需求分析一般都会有两种以上不同的思路和算法可以去探索,最后可以根据验证的效果和资源耗用等因素进行综合考虑,决定出最终的思路、算法和解决方案。

大数据、数据挖掘、数据分析、数理统计之间的关联与差异

未经允许不得转载:多面体品牌营销 » 大数据、数据挖掘、数据分析、数理统计之间的关联与差异

评论 抢沙发

  •  昵称 (必填)
  •  邮箱 (必填)
  •  网址(选填)

多面体 | 专注网络营销与新媒体广告投放

联系我们联系我们