⼤数据时代影响统计的三⼤思维转变
现在社会有⼀种观念,那就是⼤数据时代已经到来,上到国家,下到单位,都把⼤数据当做未来的发展战略。当⼤数据这⼀观点出现时,便引起了全球范围内⼴泛的反响,似乎所有的商业或组织活动都可视为⼤数据问题。⼤数据时代的到来,正在对社会济各个⽅⾯产⽣冲击,⽽与数据打交道的“统计”学,⼤数据概念将对其产⽣何种影响?产⽣什么样的影响呢?
统计学是关于数据的科学,即研究如何收集、整理和分析数据的科学。数据是依据,是根本,是⼀个分析结果的灵魂,是统计⽅法⽣命⼒的根源所在,⼤数据时代的统计⾸先要适应三个重⼤的思维转变。
第⼀,不分析少量的样本数据,⽽是要分析与事物相关的所有数据。
大数据要学什么统计往往希望⽤尽可能少的数据来证实可能重⼤的发现、假设等,⼩数据时代⼀般采⽤随机采样,⽤最少的数据获得最多的信息。统计抽样是在技术受限的条件下,解决当时存在的⼀些问题⽽产⽣的;如今的⼤数据时代,计算和制表不再像过去那样困难,感应器、⼿机导航、⽹站点击和微博等能够收集⼤量数据,⽽计算机也能够轻易处理。因此,在处理⼤数据时不再来⽤随机抽样的⽅法,⽽利⽤所有数据进⾏分析。例如:⾕歌流感趋势预测并不是依赖于对随机抽样的分析,⽽是分析了整个美国⼏⼗亿条互联⽹检索记录⽽得到的结论。分析整个数据库,⽽不是对⼀个样本进⾏分析,能够提⾼微观层
⾯分析的准确性,甚⾄能够推测出任何特定尺度的数据特征。
第⼆,不再追求百分百精确性,接受数据的复杂多样性。
与⼤数据不同的是,对⼩数据⽽⾔,最基本、最重要的要求是减少误差,保证数据质量。⽣活于信息时代的我们,掌握的数据越来越全⾯,不再只包括⼿头现象的⼀点点可怜数据,⽽是包括了与之相关的⼤量级数据甚⾄全部数据。⼈们不再那么担⼼某个数据点对整套分析的不利影响,要做的是接受纷繁的数据并从中受益。⼤数据要求⼈们能够接受混乱和允许不精确性,例如⼀个⼩商店晚上打烊的时候要把收银台⾥的每分钱都数清楚,但如果⽤“分”这个单位来精确计算国内⽣产总值显然不适⽤。⼤数据时代,随着数据规模的扩⼤,⼈们对数据精确度的痴迷将逐步减弱。
第三,不再探求难以捉摸的因果关系,转⽽关注事物的相关关系。
⼤数据时代,由于坐拥海量数据和良好的机器计算能⼒,相关关系分析为⼈们提供了⼀系列新的视野和有⽤的预测,能够出新种类数据间的相互联系来解决⽇常需要。例如:如果电⼦医疗记录显⽰橙汁和阿司匹林的特定组合可以癌症,那么出具体的致病原因就没有通过相关关系⽽获得的这种⽅法来得重要;亚马逊根据⽤户在其⽹站上的类似查询来进⾏产品推荐,也是⼤数据相关关系的典型应⽤。通过探求“是什么”⽽不是“为什么”,能够帮助⼈们更好地了解这个世界。
⼤数据时代已经到来,它实实在在地在影响我们的⽣活,给予我们便利,⽽随着它的深度渗⼊,我们的改变是必然的,转变思维,不⼀成不变,才是我们发展的所在。
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论