统计研究工作机遇与挑战

时间:2022-08-14 02:47:21

统计研究工作机遇与挑战

摘要:大数据时代的到来在拓宽统计研究范畴,丰富统计研究内容的同时也为传统统计研究工作带来了巨大的挑战;为顺应大数据时代的发展,统计研究工作应适时调整抽样调查的工作思想、深入理解数据信息、转换数据对接与处理方式、抓住数据关系分析重点、转换统计工作重心以及强化分析思维,使大数据与统计学有机结合,更好的为统计学服务,为统计研究工作的发展注入旺盛的生命力。

关键词:统计研究;大数据;统计学;数据分析

自二十世纪六十年代以来,计算机技术的快速发展,人类的生活方式发生了巨大的变化,计算机互联网、移动互联网、物联网、汽车网络越来越流行,博客,论坛,微信网络通信已经演变成人们的日常生活中,数据的积累变得越来越方便,数据共享和交流变得越来越方便,自动采集、传输的信息和计算已经出生成为现实,大数据的天然产品是高科技时代,毫无疑问,随着计算机处理技术的快速发展,能够处理大规模复杂数据增加,从大规模的数据中提取有价值的信息的能力是一天天增加,人类迅速进入大数据的时代,有大数据促进人民生活的变化,工作和的思想奠定了基础。在大数据时代,引领人们的生活中的数据,指导业务转型和科技创新中发挥着越来越重要的作用,人们几乎可以从任何获得的数据可以转化为促进人类生活方式的改变有价值的知识,以及大数据时代的战略意义不仅是掌握庞大的数据信息,并在于如何处理数据。如何从纷繁的知识中提取有价值的数据,如何利用这些数据来创建伟大的价值是我们面临的一个重要问题,大数据时代的到来,使分析数据的研究变得尤为重要,不仅带来了统计研究的发展机遇,但也给统计研究带来了前所未有的挑战。毫无疑问,随着大数据的出现,统计研究已经进入了一个新的发展阶段。

一、大数据给统计研究带来的机遇

大数据时代扩大了统计研究的范围,丰富了统计研究的内容,扩大了统计研究的活力。传统的统计研究是根据要研究的问题收集相关数据,然后组织、分析和总结。传统的统计研究一方面,无法保证数据的效率,另一方面,由于大量的数据收集非常困难,导致研究人员增加工作量。在大数据时代,统计研究工作可以分析更多的数据,甚至可以处理和某个特别现象相关的所有数据,而不再依赖于随机采样,数据的限制等因素。传统的统计研究工作与大数据相结合,(1)保证了统计信息的适应性,提高了统计调查的时效性,增加了统计研究的准确性,在整体上提高了统计研究的质量;(2)丰富了传统统计研究数据的收集方法,例如网络信息、移动通信等,同时这些数据范围广泛,可用于多个研究目标,重复利用率高,这样大大降低了统计研究工作的成本。(3)丰富了统计学的内涵,更大的发挥了统计学的作用,扩大了统计研究工作的范围。

二、统计研究工作所面临的转变

由大数据的概念与其时代属性,我们不难看出大数据具有多样性(Variety)、大量性(Volume)、高速性(Velocity)、易变性(Variabili⁃ty)、真实性(Veracity)和价值性(Value)等特点[5][6][7]。同时,大数据也给我们带来了一些观念上的转变,比如:是全部数据,而不是随机采样;是大体方向,而不是精确制导;是相关关系,而不是因果关系等等。对统计研究工作而言,这些特点与转变不仅带来了统计研究范畴的拓宽、统计研究内容的丰富,也同样带来了统计研究工作面临的颠覆性的挑战。(一)抽样调查工作思想的转变。由于数据收集和处理能力的限制,传统的统计研究工作特点是通过有限样本来了解推断总体,这也就产生了各式各样的抽样调查技术,但不可否认的是,任何抽样技术,抽到的都只是总体中的一部分,样本只能是对总体片面的、部分的反映。而在大数据时代,数据资料收集和数据处理能力对统计分析工作的影响越来越小,我们既可以了解局部又可以了解总体,那些传统抽样调查方法中的不足,诸如抽样框不稳定、随机取样困难、受调查目的限制、调查范围有限、样本量有限、抽样结果无法进一步细分、纠偏成本高等问题均可以得到改善。进入大数据时代,虽然分析整个过程是可能的,但这并不意味着抽样,但这并不意味着抽样是无用的。至少就目前而言,不是所有的行业都有实现智能化,并不是所有的数据都可以通过网络获得的信息系统,有很多数据只能通过传统的方法,抽样调查;而且,甚至网络数据,在某些情况下,分析整体也不是最好的选择,在某些情况下,抽样调查是更重要的比分析的总时间。(二)对数据精确性要求的转变。传统的统计研究工作是对数据进行抽样分析,研究工作是希望尽可能用有限的数据来全面准确的反映和推断总体,对数据的精确性要求非常高,数据的不精确主要集中在人为因素以及自然不可控因素。而在大数据时代,数据规模大,数据来源广泛,数据不精确性在所难免,很多情况下统计研究工作已经放弃了样本研究方法,从而变成对于总体的研究。但大数据时代下的这种不精确数据并不一定妨碍我们认识总体,也有可能帮助我们从另一个方向更好地认识总体。数据的这种不精确性提供的越来越多的信息,有利于我们更好地了解总体的真实情况。(三)数据对接与处理方式的转变。传统的数据是结构化数据可以使用的常规统计指标体现或是坐标图阻碍数据固有结构和根据这一标准数据的知识,具备方式已经相当成熟,并且比较容易,得到可以直接进行分析的结果。相反,数据不仅结构化数据也全面反结构化数据、联合数据和非结构化数据可以储存的所有记录和的信号,具备多种多样的特性,传统的统计指标一定要完整地可以表现暴露出来。这些数据的概念,必然会拓展如何有效实现结构化数据和非结构化的数据对接问题。实际工作上的多种类型的数据的数据进行分析的基础上,提高对对象的多种类型的描写和数据测度的能力。传统的统计分析注重推断,分析的统计数据,更加注重表现透露,这是周密地为了观察。对刀片怎么目的和统计数据结构化收集大量需求比结热点透视构化数据中发掘并有价值的信息并有机结合,相辅相成的剩下的课题,讨论如何能够实现非结构化数据结构化更好的分析、结构化数据与否,可以使用非结构化表示:“更容易调整等以课题中需要解决的问题。franks也几乎没有。分析过程直接对非结构化分析数据也没有直接在非结构化的数据而得出的结论。目前计算机学界已着手研究开发(r&d)的技术数据处理结构化直接通过统计数据结构化处理费或具备知识的数据、结构化性非常重要的研究领域。我们坚信通过各种方法特定结构化数据和非结构化的数据完美地实现竭尽全力地的。(四)数据关系分析重点的转变。传统的统计数据处理一般分析工作时,事先搞清事物之间存在某种因果关系后,在解决因果关系的基础上制定构建验证的家庭,事先模型因果关系。大数据时代、数据时代衍生出的对统计分析的创意和技术的革新开阔的视野我们”,他看到很多可以去未发现之前发现的事物之间的联系,可在年初大容量数据上发现的各种存在相关关系。我们分析数据时再探索捕捉不到的因果关系事物的寒霜关注根据关系变量或现象之间的相互关系进行了此及由表及由、彼里的关联。根据奥姆数据时代的重要任务之一的大规模相关的分析。然而,大学的数据,“什么”和“为什么”的时代要求,只有这样,我们才能更好地理解“什么是它?”真正了解数据的原因和背景。因果关系很重要,他决定深入分析数据。如果一半的数据分析与深度的程度有关,如果进行分析的话,第一个是我们感到困惑。因果关系可以帮助我们更好地利用相关性,例如,某事物的原因可能是共同的结果,所以诸如事物之间的关联。我们可以帮助更理性的决策,甚至预测未来。事物的因果关系,可以用于进一步的好莱坞数据。另一方面,两者之间因果关系的基础。相关分析和对平行抗辩的分析,额外的学分可以补充和。(五)统计研究工作的重心的转变。传统统计研究所工作的重心将收集的基础资料原委的数据、大数据的时代,则更什么样的选择有用的数据。专门的抽样调查中充分关注设计统计的提取样本机随性并不那么多的音响带来了不小的冲击。大学时代、统计数据,可能会面临处理。许多非随机数据,如何辨别音响效果更为突出的任务。除此之外,掌握的资料,选择颇显着。如果有缺陷的依赖的数据,如果决策产生相当大的影响。但同时也应该清楚的数据,并不能掩盖所有数据前也是相对的再加上一定是一个具有代表性的样本的情报的人,呈指数增长需要验证”的假设了同样的快速增长。亟待解决的问题和复杂,而且水平也同样的速度增长。更好的方法,对日寻求信号和音响效果的区别。信息只接受了旨在查明真相的必要条件,不是充分条件。但无信息不真相查明真相就达信息。数据可以满足既定事实化的其用途,才可以高质量的数值过于依赖。(六)统计研究中分析思维的转变。(1)传统的统计分析过程分为三个步骤:稳定性、定量和定性。首先,有必要通过经验找到统计方向,其目的是掌握知识、分析数据和处理数据。我们可以根据结果得出最终结论。数据、定量统计分析过程是发现“有限数量的各种直接信息的极限”的基础,对我们所需要的信息进行分析,找出数据的特征和数量关系,并在判断和决策的基础上进行分析。(2)传统的统计实证分析的路径通常是“假设-测试”,即根据统计数字的第一项建议,继续假设、数据收集、分析,最后得出结论。事实证明,这种经验分析有很大的误差。在实证分析大数据的时代,很难找到思考绝不是一个简单的假设检验,但“发现-总结”,全面和深入的了解研究对象,因此,整合数据,发现规则的关系,找到了,反复总结,结论,这将帮助更多,发现惊喜。(3)传统的统计分析认为,在保证的前提下基于分布逻辑概率的分析过程,是对整个推理的,通常根据推理特征的一般特征,根据推理特征来判断样本的轮廓是正确的。现在这个过程是实际分布的基础上,所有的功能,并确定什么时间的概率是政治对手或动态大学数据对象是所有的数据的大小不需要遵循分布理论说:“与一般特征相比,计算方法,根据推迟[2]。(七)统计研究中应用技术的转变传统的统计研究分析技术手段已经不能满足大数据信息数据研究的需要,进入大数据时代,统计研究工作与计算机的结合变得更加紧密。统计研究工作的进行不仅仅局限于掌握统计体系知识,对计算机技能的要求也开始变得越来越依赖,数据库、数据结构、统计软件、算法设计、程序编码等都是大数据时代统计研究工作中不可或缺的应用技术,同时融汇统计技术与计算机技术可以帮助我们更加便捷的处理统计研究工作,更好的解决复杂的数据处理问题,更大的发挥统计研究工作的作用。

三、小结

一个新生事物的出现将必定导致传统观念和技术的革命。大数据的到来,以其多样性(Variety)、大量性(Volume)、高速性(Ve⁃locity)、易变性(Variability)、真实性(Veracity)和价值性(Value)等特点弥补了统计研究高成本、高误差的劣势,同时也重新定义了统计研究工作的含义,对传统的统计研究工作提出了诸多的挑战。但这并不意味着统计研究工作就此结束,反而使其可以在越来越多的领域得以应用,统计研究人员应及时认清大数据给统计研究工作带来的潜力,在抽样调查的工作思想、数据信息重新认识、数据对接与处理方式、数据关系分析重点、统计工作重心以及分析思维等方面进行转变,依靠深厚的统计研究方法对大数据思想进行系统的理论、实践研究,创造出迎合大数据的新统计方法,扩大统计研究工作应用领域,并且使统计学科得以延伸,提高了统计学科在自然科学和社会科学中的地位,这对统计研究工作者来说虽然是挑战,但更大的则是机遇。我们应该牢牢抓住大数据带来的机遇,沉着冷静的应对挑战,将大数据与统计研究有机地结合,使统计研究及统计学科更加适应现代社会发展需求。

作者:王舒 单位:中国人民大学

参考文献:

[1]朱建平,章贵军等.大数据时代下数据分析理念的辨析[J].统计研究,2014.2(31)10-17

[2]朱建平,张悦涵.大数据时代对传统统计学变革的思考[J].统计研究,2016.2(33)3-9

[3]符一平.浅谈统计学在大数据时代面临的机遇、挑战及其发展趋势[J].教育教学究,2016.7(19)245-246

[4]张艳.大数据时代的统计研究[J],统计聚焦,2016(9)6-7

[5]GrobelinkM.Big-datacomputing:Creatingrevolutionarybreakthroughsincommerce,scienceandsociety[N/OL].Scientificdoc⁃umentsthatcitethefollowingpaper,2012.10(2).

[6]BrianHopkins,BorisEvelson.Expandyourdigitalhorizonwithbigdata[N/OL]Forrester,2011.9(30).

[7]刘念真.利用Oracle信息模型驾驭大数据[R],https://wenku.baidu.com.

[8]邱东.大数据时代对统计学的挑战[J].统计研究,2014.1(31)16-22