统计学大数据分析十篇

时间:2023-07-19 17:37:48

统计学大数据分析

统计学大数据分析篇1

关键词:大数据;统计学;数据分析;抽样理论;理论

重构随着信息科学技术的高速度发展,当代获取和储存数据信息的能力不断增强而成本不断下降,这为大数据的应用提供了必要的技术环境和可能.应用大数据技术的优势愈来愈明显,它的应用能够帮助人类获取真正有价值的数据信息.近年来,专家学者有关大数据技术问题进行了大量的研究工作[1],很多领域也都受到了大数据分析的影响.这个时代将大数据称为未来的石油,它必将对这个时代和未来的社会经济以及科学技术的发展产生深远的意义和影响.目前对于大数据概念,主要是从数据来源和数据的处理工具与处理难度方面考虑,但国内外专家学者各有各的观点,并没有给出一致的精确定义.麦肯锡全球数据分析研究所指出大数据是数据集的大小超越了典型数据库工具集合、存储、管理和分析能力的数据集,大数据被Gartner定义为极端信息管理和处理一个或多个维度的传统信息技术问题[23].目前得到专家们认可的一种观点,即:“超大规模”是GB级数据,“海量”是TB级数据,而“大数据”是PB及其以上级别数据[2].

一些研究学者把大数据特征进行概括,称其具有数据规模巨大、类型多样、可利用价值密度低和处理速度快等特征,同时特别强调大数据区别于其他概念的最重要特征是快速动态变化的数据和形成流式数据.大数据技术发展所面临的问题是数据存储、数据处理和数据分析、数据显示和数据安全等.大数据的数据量大、多样性、复杂性及实时性等特点,使得数据存储环境有了很大变化[45],而大部分传统的统计方法只适合分析单个计算机存储的数据,这些问题无疑增加了数据处理和整合的困难.数据分析是大数据处理的核心过程,同时它也给传统统计学带来了巨大的挑战[6].产生大数据的数据源通常情况下具有高速度性和实时性,所以要求数据处理和分析系统也要有快速度和实时性特点,而传统统计分析方法通常不具备快速和实时等特点.基于大数据的特点,传统的数据统计理论已经不能适应大数据分析与研究的范畴,传统统计学面临着巨大的机遇与挑战,然而为了适应大数据这一新的研究对象,传统统计学必须进行改进,以继续和更好的服务于人类.目前国内外将大数据和统计学相结合的研究文献并不多.本文对大数据时代这一特定环境背景,统计学的抽样理论和总体理论的存在价值、统计方法的重构及统计结果的评价标准的重建等问题进行分析与研究.

1传统意义下的统计学

广泛的统计学包括三个类型的统计方法:①处理大量随机现象的统计方法,比如概率论与数理统计方法.②处理非随机非概率的描述统计方法,如指数编制、社会调查等方法.③处理和特定学科相关联的特殊方法,如经济统计方法、环境科学统计方法等[7].受收集、处理数据的工具和能力的限制,人们几乎不可能收集到全部的数据信息,因此传统的统计学理论和方法基本上都是在样本上进行的.或者即使能够得到所有数据,但从实际角度出发,因所需成本过大,也会放弃搜集全部数据.然而,选择最佳的抽样方法和统计分析方法,也只能最大程度还原总体一个特定方面或某些方面的特征.事实上我们所察觉到的数据特征也只是总体大量特征中的一小部分,更多的其他特征尚待发掘.总之,传统统计学是建立在抽样理论基础上,以点带面的统计分析方法,强调因果关系的统计分析结果,推断所测对象的总体本质的一门科学,是通过搜集、整理和分析研究数据从而探索数据内部存在规律的一门科学.

2统计学是大数据分析的核心

数的产生基于三个要素,分别是数、量和计量单位.在用数来表示事物的特征并采用了科学的计量单位后,就产生了真正意义上的数据,即有根据的数.科学数据是基于科学设计,通过使用观察和测量获得的数据,认知自然现象和社会现象的变化规律,或者用来检验已经存在的理论假设,由此得到了具有实际意义和理论意义的数据.从数据中获得科学数据的理论,即统计学理论.科学数据是通过统计学理论获得的,而统计学理论是为获得科学数据而产生的一门科学.若说数据是传达事物特征的精确语言,进行科学研究的必备条件,认知世界的重要工具,那么大数据分析就是让数据最大限度地发挥功能,充分表达并有效满足不同需求的基本要求.基于统计学的发展史及在数据分析中的作用,完成将数据转化为知识、挖掘数据内在规律、通过数据发现并解决实际问题、预测可能发生的结果等是研究大数据的任务,而这必然离不开统计学.以大数据为研究对象,通过数据挖掘、提取、分析等手段探索现象内在本质的数据科学必须在继承或改进统计学理论的基础上产生.

统计数据的发展变化经历了一系列过程,从只能收集到少量的数据到尽量多地收集数据,到科学利用样本数据,再到综合利用各类数据,以至于发展到今天的选择使用大数据的过程.而统计分析为了适应数据可观察集的不断增大,也经历了相应的各个不同阶段,产生了统计分组法、大量观察法、归纳推断法、综合指标法、模型方程法和数据挖掘法等分析方法,并且借助计算机以及其他软件的程度也越来越深.300多年来,随着数据量以指数速度的不断增长,统计学围绕如何搜集、整理和分析数据而展开,合理构建了应用方法体系,帮助各个学科解决了许多复杂问题.现在进入了大数据时代,统计学依旧是数据分析的灵魂,大数据分析是数据科学赋予统计学的新任务.对于统计学而言,来自新时代的数据科学挑战有可能促使新思想、新方法和新技术产生,这一挑战也意味着对于统计学理论将面临巨大的机遇.

3统计学在大数据时代下必须改革

传统统计学是通过对总体进行抽样来搜索数据,对样本数据进行整理、分析、描述等,从而推断所测对象的总体本质,甚至预测总体未来的一门综合性学科.从研究对象到统计结果的评判标准都是离不开样本的抽取,完全不能适应大数据的4V特点,所以统计学为适应大数据技术的发展,必须进行改革.从学科发展角度出发,大数据对海量数据进行存储、整合、处理和分析,可以看成是一种新的数据分析方法.数据关系的内在本质决定了大数据和统计学之间必然存在联系,大数据对统计学的发展提出了挑战,体现在大样本标准的调整、样本选取标准和形式的重新确定、统计软件有待升级和开发及实质性统计方法的大数据化.但是也提供了一个机遇,体现在统计质量的提高、统计成本的下降、统计学作用领域的扩大、统计学科体系的延伸以及统计学家地位的提升[7].

3.1大数据时代抽样和总体理论存在价值

传统统计学中的样本数据来自总体,而总体是客观存在的全体,可以通过观测到的或经过抽样而得到的数据来认知总体.但是在大数据时代,不再是随机样本,而是全部的数据,还需要假定一个看不见摸不着的总体吗?如果将大数据看成一个高维度的大样本集合,针对样本大的问题,按照传统统计学的方法,可以采用抽样的方法来减少样本容量,并且可以达到需要的精度;对于维度高的问题,可以采取对变量进行选择、降维、压缩、分解等方法来降低数据的复杂程度.但实际上很难做得到,大数据涵盖多学科领域、多源、混合的数据,各学科之间的数据融合,学科边界模糊,各范畴的数据集互相重叠,合成一体,而且大数据涉及到各种数据类型.因此想要通过抽样而使数据量达到传统统计学的统计分析能力范围是一件相当困难或是一件不可能的事.大量的结构数据和非结构数据交织在一起,系统首先要认清哪个是有价值的信息,哪个是噪声,以及哪些不同类型的数据信息来自于同一个地址的数据源,等等,传统的统计学是无法做到的.在大数据时代下,是否需要打破传统意义的抽样理论、总体及样本等概念和关系,是假设“样本=总体”,还是“样本趋近于总体”,还是不再使用总体和样本这两个概念,而重新定义一个更合适的概念,等等.人们该怎样“安排”抽样、总体及样本等理论,或人们该怎样修正抽样、总体、样本的“公理化”定义,这个问题是大数据时代下,传统统计学面临改进的首要问题.

3.2统计方法在大数据时代下的重构问题

在大数据时代下,传统的高维度表达、结构描述和群体行为分析方法已经不能精确表达大数据在异构性、交互性、时效性、突发性等方面的特点,传统的“假设-模型-检验”的统计方法受到了质疑,而且从“数据”到“数据”的统计模式还没有真正建立,急切需要一个新的理论体系来指引,从而建立新的分析模型.去除数据噪声、筛选有价值的数据、整合不同类型的数据、快速对数据做出分析并得出分析结果等一系列问题都有待于研究.大数据分析涉及到三个维度,即时间维度、空间维度和数据本身的维度,怎样才能全面、深入地分析大数据的复杂性与特性,掌握大数据的不确定性,构建高效的大数据计算模型,变成了大数据分析的突破口.科学数据的演变是一个从简单到复杂的各种形式不断丰富、相互包容的过程,是一个循序渐进的过程,而不是简单的由一种形式取代另一种形式.研究科学数据的统计学理论也是一样,也是由简单到复杂的各种形式相互包容、不断丰富的发展过程,而绝不是完全否定一种理论、由另一种理论形式所代替.大数据时代的到来统计学理论必须要进行不断的完善和发展,以适应呈指数增长的数据量的大数据分析的需要.

3.3如何构建大数据时代下统计结果的评价标准框架

大数据时代下,统计分析评价的标准又该如何变化?传统统计分析的评价标准有两个方面,一是可靠性评价,二是有效性评价,然而这两种评价标准都因抽样而生.可靠性评价是指用样本去推断总体有多大的把握程度,一般用概率来衡量.可靠性评价有时表现为置信水平,有时表现为显著性水平[8].怎么确定显著性水平一直是个存在争议的问题,特别是在模型拟合度评价和假设检验中,因为各自参照的分布类型不一样,其统计量就不一样,显著性评价的临界值也就不一样,可是临界值又与显著性水平的高低直接相关.而大数据在一定程度上是全体数据,因此不存在以样本推断总体的问题,那么在这种情况下,置信水平、可靠性问题怎么确定?依据是什么?有效性评价指的是真实性,即为误差的大小,它与准确性、精确性有关.通常准确性是指观察值与真实值的吻合程度,一般是无法衡量的,而精确性用抽样分布的标准差来衡量.显然,精确性是针对样本数据而言的,也就是说样本数据有精确性问题,同时也有准确性问题.抽样误差和非抽样误差都可能存在于样本数据中,抽样误差可以计算和控制,但是非抽样误差只能通过各种方式加以识别或判断[910].大多数情况下,对于样本量不是太大的样本,非抽样误差可以得到较好的防范,然而对于大数据的全体数据而言,没有抽样误差问题,只有非抽样误差问题,也就是说大数据的真实性只表现为准确性.但是由于大数据特有的种种特性,使得大数据的非抽样误差很难进行防范、控制,也很难对其进行准确性评价.总之,对于大数据分析来说,有些统计分析理论是否还有意义,确切说有哪些统计学中的理论可以适用于大数据分析,而哪些统计学中的理论需要改进,哪些统计学中的理论已不再适用于大数据统计研究,等等,都有待于研究.所以大数据时代的统计学必是在继承中求改进,改进中求发展,重构适应大数据时代的新统计学理论.

4结论

来自于社会各种数据源的数据量呈指数增长,大数据对社会发展的推动力呈指数效应,大数据已是生命活动的主要承载者.一个新事物的出现,必然导致传统观念和传统技术的变革.对传统统计学来说,大数据时代的到来无疑是一个挑战,虽然传统统计学必须做出改变,但是占据主导地位的依然会是统计学,它会引领人类合理分析利用大数据资源.大数据给统计学带来了机遇和挑战,统计学家们应该积极学习新事物,适应新环境,努力为大数据时代创造出新的统计方法,扩大统计学的应用范围.

参考文献:

[1]陈冬玲,曾文.频繁模式挖掘中基于CFP的应用模型[J]沈阳大学学报(自然科学版),2015,27(4):296300.

[3]卞友江.“大数据”概念考辨[J].新闻研究导刊,2013,35(5):2528.

[5]靳小龙,王元卓,程学旗.大数据的研究体系与现状[J].信息通信技术,2013(6):3543.

[6]覃雄派,王会举,杜小勇,等.大数据分析:Rdbms与Mapreduce的竞争与共生[J].软件学报,2012,23(1):32-45.

[7]游士兵,张佩,姚雪梅.大数据对统计学的挑战和机遇[J].珞珈管理评论,2013(2):165171.

[8]李金昌.大数据与统计新思维[J].统计研究,2014,31(1):1017.

统计学大数据分析篇2

关键词:大学生党员;评价标准;模型;spss;数据分析

中图分类号:G642 文献标志码:A 文章编号:1002-2589(2012)33-0198-03

一、大学生党员素质模型研究的背景

随着“90后”一代步入大学殿堂,青年大学生追求个性和自我的特点越来越显著,大学生党员发展和培养工作遇到了新的挑战,如何结合当代青年大学生党员特点开展党建教育工作、如何发挥学生党员的积极带动作用以及如何衡量党员素质等问题越来越多地引起高校思政教育工作者的关注。

一直以来,高校发展学生党员都严格遵守“优中选优”的要求,大学生党员不仅在专业科研方面有突出的成绩,在学生工作等方面也是骨干,他们应该是优秀大学生的代表,但我们会发现,大学生党员在学生群体中的带动作用一直不够明显,党员个体的优秀成绩在带动普通同学方面并不能起到积极的作用。究其原因,认为是学生对学生党员个体没有完全的认同,党员的表现与普通同学对他的期望之间存在的差距过大,以至于党员没有成为同学学生学习的榜样,导致带动作用明显减弱。这就意味着思政教育者在发展和培养学生党员时不仅要关注发展对象个人的情况,更需要了解当代学生群体对大学生党员有怎样的期望,只有培养和选拔符合党员基本要求同时又迎合当代青年期望的学生党员才能真正体现当代大学生的积极风貌,受到学生群体的认同。

需要从学生的角度开展大学生党员素质模型的研究,通过了解学生对大学生党员的期望,建立当代大学生的素质评价模型,用于培养和发展当代大学生党员的工作实践。

二、基于spss统计数据分析的大学生素质模型构建

(一)构建模型的数据收集及信度验证

根据研究的要求,首先开展访谈工作,访谈分两次进行,第一次抽取了文科、理科、工科和艺术类学生党员20人。第二次从四种学科类型专业中各个年级随机抽选一名男生和一名女生同学,共32人开展访谈。访谈的内容围绕“我心目中的学生党员”展开。由学生提出党员应该具备的具体素质。通过访谈笔者总结出38条内容,分为“道德品行”、“政治素养”、“学习能力”、“工作能力”、“心理素养”几方面的内容,并以此作为模型建立的核心调查内容。

调查的问卷采用“李克特”五点量表,对访谈生成的38条建议进行评价,要求被调查者根据自己对学生党员的期望来判断学生党员是否必须做到这一点要求,其中1表示“非常不同意”、2表示“不同意”、3表示“不能确定”、4表示“同意”、5表示“非常同意”。每个问题采用随机排序的方式组成问卷主体。

为了使设计出的问卷更加科学和合理,能够为绝大多数被调查者所理解和接受,在正式大规模发放问卷之前又进行了小范围的预调研,调研的重点在于验证问卷中各问题的提法是否科学,是否存在理解上的歧义和含义上的遗漏,是否便于被调查者理解。

在正式的调查中采取随机抽样的方式对东华大学及少数上海市其他高校校内在校生开展调查,通过在“学生街”现场发放和回收以及发放电子邮件的形式,共发放问卷300份,回收294份,通过有效性筛选的问卷为188份。

在获得有效数据后,通过Spss软件对问卷信度用克隆巴赫(Cranach’s α)系数测量,该系数表示问卷调查结果总变异中由不同被调查者导致的比例占多少。整个问卷和各个子问卷的克隆巴赫系数如表所示:

Cronbach's α系数值介于0与1之间,α值越大表示问卷题目间相关性越好,内部一致性可信度越高。本问卷在各个问卷因素间的值均达到了0.7左右,且总问卷值为0.788,问卷的稳定性和一致性是有一定保障的。

(二)通过因子分析的方法构建模型

在保证了调查研究有效性的前提下,通过spss数据分析中因子分析的方法,进一步确立学生心中的党员素质模型,进行因子分析时,原则上应该将所有变量的测量一并纳入因子分析中;但是,当变量的个数太多时,采取这种做法不太适合。因此,本研究将所有变量分为五大类分别进行因子分析,即道德品行、政治素养、学习能力、工作能力和心理状态几个分类。

为了验证获得的数据的有效性,进行了Bartlett's Test和KMO指标检验。Bartlett's Test 检验的sig为0.000显著,说明参与分析的数据来自正态分布的整总体,即数据相关数阵不是单位矩阵,KMO测度的目的是检验采样的充分性如何。KMO的取值在0~1之间,其值愈逼近1,表明对这些变量进行因子分析的效果愈好。研究分析的结果显示KMO在0.7~0.8之间,表明适合作因子分析。检验具体结果如下表所示:

在因子分析过程中,本研究采用主成分分析法、旋转变换法。在分析过程中,按照剔除无法解释指标和载荷值在0.5以下的指标来筛选指标。

首先我们对道德品行分类进行因子分析,结果如下表所示,从表3中可以看出,该类别由3个因子组成,结合载荷值和指标的内容,将因子分别定义为继承传统美德、遵守社会公德和无私奉献精神三个方面的指标。详细的内容如表4所示。

因子分析的结果表明,当代大学生对大学生党员的道德品行要求是比较全面的,不仅包含了我们以往评价党员的奉献精神,还包含了对传统美德的继承和公民素质的要求,这要求学生党员不仅在大的利益面前要懂得取舍,还要在生活细节方面有较强的奉献意识。遵守《公民道德规范》,在成为模范公民的同时,从事社会活动要具备较强的道德判断能力,主动帮助弱势群体,在构建和谐社会过程中发挥作用。在学校生活中,学生党员不能居功自傲,积极分子更不能凭借为集体作出贡献就认为理所应当成为党员,个人道德品行是在平时的一举一动中表现出来,教师在培养和发展党员过程中不能以点概面。

使用同样的因子分析方法,我们对其他几类要素进行分析。

在政治素养方面,因子分析的结果表明有两方面的具体指标,分别为“鲜明的政治立场”和“社会正义感”。其中“鲜明的政治立场”指标要求学生党员要熟练掌握马克思主义理论等党的基本理论知识,对入党有正确的认识并能维护党的利益,有鲜明的政治观点、政治鉴别力和思想觉悟,具有坚定的社会主义理想信念。有些学生党员没有热情学习党的基本理论知识,在同学中有时以传播负面新闻赚取同学们的关注,在同学对党有误解时不能挺身出来解释,不能表明自己的政治立场,存在以上问题的学生党员将会大大减少普通同学对党员群体的认可度,减低学生党员在群众中的影响力。社会正义感的评价指标要求学生党员要处处明确自己作为学生党员的责任,要主动关心和了解社会现状和发展前景,忠于国家和人民,具备分析社会热点问题和分辨是非的能力,有端正的人生观和价值观,同时能积极引领校园文化,成为构建和谐文化的主力。只有具备社会正义感的学生党员才能赢得学生的信任,才能在学生中起到真正的带头作用。

一个人的心理素质是保证个体全面发展的基础条件,因此大学生党员必须具备健康的心理素质,具备积极适应社会、调节自我的心理状态,通过因子分析的方法得出“自我管理能力”、“沟通能力”和“荣誉感”几方面的指标在大学生党员评价中比较重要。自我管理能力是指学生党员需要具备较强的生活自理能力和规划能力,能很快适应大学生活同时积极为今后的发展做好准备,这要求大学生党员要具备一定的适应能力、抗挫能力、自制能力和情绪调节能力。随着新一代青年走进大学校园,大学适应和生涯规划的概念逐渐引入大学新生教育工作,学生的自我管理能力一定程度上决定了在大学期间他取得的成绩,具备良好的自我管理能力,是成为学生党员的必修课,只有把自己的事情管理规划得好,才能更好地为他人服务。沟通能力指标要求学生党员要有较好的人际协调能力,能妥善处理人际关系,这也是大学生能积极适应社会、融入社会、服务社会的必然要求。大学生党员在追求个性的同时,要学会与周围同学沟通,才能在同学中起到积极的带动作用,党员的先进性才能辐射到学校生活的各个方面。荣誉感指标要求学生党员要有较强的荣辱观念,热爱自己的祖国,有集体责任感。学生党员作为全党未来发展的生力军,也是我国社会未来的接班人,他们中的一些人将会肩负起国家发展的重任,也将成为各个行业的领军人才,热爱自己的祖国,对集体负责是个人发展的动力,学生党员只有具备集体荣誉感和爱国热情才能不断地激发自己的才智,为社会发展作出贡献。

对学习能力和工作能力两方面进行因子分析,均为一个主要因子。所以将学习能力和工作能力作为具体的指标进行解释。学习能力要求学生党员要具备端正的学习态度,掌握学习方法,同时要有优秀的学习成绩,能够做到把理论学习与实际需求联系到一起,做到学以致用,有创新精神,不是“死读书、读死书”,这是大学生党员今后能担任起社会发展重任的基本要求,只有掌握了丰富的科学文化知识,学会学习,才能正确处理好各种社会问题和把握自己的未来。工作能力指标要求学生党员具备一定的担当学生干部的能力,具有一定的组织和策划、领导能力,有一定的号召能力,在从事学校社会工作的同时积极锻炼自己的创新能力和创造能力,敢于尝试和提出新的想法,学会实事求是地分析和处理问题,保持思想与社会发展的一致性,以便大学毕业后能更好地融入社会。这两项指标在高校平时培养和发展学生党员时最容易衡量优略,因此也最为常用。但往往成为衡量学生党员的全部标准,使得学生党员的影响能力大大降低,学生党员绝不是“学习好+工作好”的代名词,学习好和工作好要成为学生党员普遍具备的素质,但更重要的是要有坚定的政治素养和优秀的个人品质。

三、大学生党员素质模型的现实指导结论

以上的分析是在对在校大学生调查的基础上展开的,突出了在校大学生对大学生党员的具体要求和期望,从分析的结论中我们可以看出,在校大学生对党员的看法和认识还是比较全面的,涵盖了学习、工作、生活和思想四大方面,立足于大学生具体的生活,以校园为核心考查领域并逐步扩展到社会范围,具有很强的现实指导意义。纵观以上分析结果,我们可以的出以下结论:

首先,评价标准要求的针对性强,突出了大学生的特色。以往有较多的党员评价标准,也强调了党员的党性、先进性、奉献精神等各个方面,但都过于普遍,适用于各个行业的党员干部,这是由于这些标准是以学生党员进入社会的要求为基本展开的,和校园生活结合不紧密,并不能体现学生党员在学校培养过程中的特点,忽略了学校培养教育的关键点。比如在个人品质要求方面,以往的标准在对学生党员奉献意识强调的同时往往忽视作为公民个人的基本要求,这就会将学生党员教育变成空中楼阁,可望却不可及。而从全体学生的角度开展的学生党员期望调查中就能很好地结合大学生党员自我发展和认知过程中的每个细节,符合青年学生的心理和思想状态,能更好地涵盖大学生党员教育培养过程中的各个环节,更能被青年学生接受。

其次,评价标准要求的涉及范围广,合格公民的标准是底线。通过分析,可以看出,当代青年大学生对党员的素质要求内容范围较广,不仅在学校生活各个方面提出了具体的要求,对其社会层面的活动也有积极的期望,希望大学生党员能作为社会一份子,能继承和发扬传统的美德,对构建和谐友爱的社会风气起到积极的作用。不仅要求在学校做“优秀学生”,在社会活动中更要做“好公民”,遵守社会公德和法律,积极引领有秩序的社会生活,大学生党员的素质模型基础是在合格公民的要求上有进一步的提升,强调了大学生作为社会人方面的要求,这与以往对学生党员的要求是不同的,有一定的拓展。

再次,评价标准要求的思想深度深,强调具备过硬政治素养。在以上的党员素质模型要求中,可以看出,青年大学生对党员同学的思想要求深度高,要求学生党员不仅要了解党内的政策、理论,还要在行动中表现出作为共产党员的政治分析能力,有过硬的分辨是非能力,这是全党加强执政能力建设所带来的积极效应,作为学生党员受到普通同学的信任和支持,在政治素养方面应该起到积极的引导作用,这一点说明青年大学生对于党员的认识更加深入,对于党员同学具备的政治素养有较高的期望,这相对以往大部分学生认为大学生党员就是品学兼优的“好学生”的看法来说是一个巨大的进步。

最后,评价标准要求的内外统一性高,党员素质要求重实效。不仅要求学生党员要具备某项优秀的素质,还要时刻发挥出积极的引导作用。在以上的分析中,可以发现,新时期大学生对于学生党员的素质要求在思想要求和行动要求方面内外统一性高,要求学生党员不仅要在学习和工作中能做到优秀,在思想、品德及心理素质方面也要有一定的高度,同时要将自己的先进性不断地辐射到周围的环境中,起到带动作用,要求在衡量和评价学生党员时要看实效,看各个方面的具体表现,对于细节的关注更多。

通过调查和分析大学生对学生党员的期望,可以更全面地了解目前高校学生中需要的什么样的学生党员作为榜样,党建教育者应该在培养好学生、好公民的基础上重点培养学生党员对党员责任的认识,提高政治素养,这与青年学生对党员的认知是一致的,好学生不等于好的学生党员,只有培养和发展具备较高政治素养的合格公民,才能成为符合学生期望的学生党员,才能成为积极引领校园文化的优秀分子,才能担负起发展社会的重担,成为未来社会的合格建设者。

参考文献:

[1]章文波,陈红艳.实用数据统计分析及spss12.0应用[M].北京:人民邮电出版社,2006.

[2]杨晓静.大学生素质模型的构建[J].科教文汇,2011,(4).

统计学大数据分析篇3

关键词:总体数据;相关性;个性化营销;定制服务

随着科技的发展,大数据已经成为信息时代的一场技术革命。大数据是指传统数据库管理工具难以处理的大量的、多样化的数据。当前普遍认为大数据有3个特点:第一,数据量非常大;第二,数据增长速度非常快;第三,数据类型越来越多样化[1]。零售业作为传统的线下实体经营行业,积累了大量的消费者以及管理层的数据,如果依靠传统的统计学模型对这些数据进行分析,很难得出可以用于企业经营管理的有效信息,加上年轻一代消费者越来越追求个性化,所以传统统计学所采用的根据部分样本推断总体的分析方法已经无法满足市场的个性化需求,因此,传统统计学要想跟上时展的步伐,就必须做出与之相适应的改变。

1零售行业里大数据与传统统计学的区别

维克多•迈克尔在《大数据时代》一书中提出了大数据思维的3个最显著的变化:一是样本等于总体。这与过去基于样本进行统计分析的思维截然不同;二是不再追求精确性。在大数据中往往存在“噪音”和罕见事件,这样的数据影响了结果的精确性;三是相关分析比因果分析更重要,在大数据时代我们将注意力更多地放在“是什么”而不是“为什么”[2]。大数据的以上特性在零售行业同样适用,零售行业的大数据与传统统计学的区别有以下3点。第一,大数据收集总体数据,而传统统计学多采用抽样的方式收集部分数据。传统统计学在做统计分析时首先针对某一个问题提出假设,然后确定需要调查对象的总体,由于数据采集存在一定的难度,所以统计分析采取从总体中随机抽样选取一部分数据作为分析的对象,如此的话对随机抽样的方法与数据采集的准确性要求是非常高的。而大数据收集的是数据“总体”,在进行分析的时候不会人为进行假设,排除了人的干扰因素,仅仅从数据本身出发进行数据分析。在零售行业如果能运用大数据思维分析数据,从产生数据的顾客行为本身出发,针对不同顾客做出个性化营销,而不是人为假设的话,管理层就可以根据数据进行预测,避免了主观的经验与直觉的判断。沃尔玛作为零售行业的巨头,运用大数据分析得出的著名的啤酒与尿布理论可以证明这一点。第二,大数据注重个体行为的研究,统计学用样本数据推断总体行为。传统的统计学采用抽样调查的方式对样本数据进行分析,用样本推断总体,那些在图表上反映出来的异常数据被排除在外。大数据包容一切数据,其中包括各种结构化、半结构化、非结构化甚至是异构数据。对于零售行业而言,顾客的总体行为表现是没有意义的,因为每个顾客的需求不同,在不同的时间和地点需要的商品都不同,只有根据每位顾客的不同行为进行个性化服务才能让线下的零售行业有优势可言。美国高档连锁百货Nordstorm最近开始采用线下实体店客流分析服务供应商EuclidAnalytics公司的客流监测解决方案EuclidZero,基于用户连接Wifi行为来获取店内顾客手机的Mac物理地址并进行线下追踪,由此可以通过单个顾客在百货店里的行动路线和滞留时间,从而用于改善商品罗列与室内动线以及顾客个性化偏好与推荐服务[3]。第三,大数据注重数据之间的相关性,而传统统计学更加关注数据分析的结果。从社会发展的角度来看,大数据对数据的关联性分析更有助于零售行业管理层做出决策。对于传统零售行业而言,线下的用户体验是非常重要的,如果能根据用户行为数据分析出哪些商品放在一起能促进购买力,那么零售行业将会有更大的利润空间,相比之下,统计学进行的结果分析显得没有那么重要。

2大数据在零售行业的优势

迈克尔•舍恩伯格说:大数据发展的核心动力就是人类测量、记录和分析数据的渴望。第一,大数据收集的数据是多样化的、非标准化的,而统计学收集的数据都是标准化、结构化的,统计学无法对非结构化的数据进行分析与测量。但是在零售行业仅仅对标准化的数据进行分析做出的判断已无法满足行业的需求,通过对用户在商品前滞留的时间以及与货架上商品的互动行为产生的数据进行分析,从而调整货架的位置才是主流。第二,大数据可以实时、快速监测与收集数据,而统计学收集数据时间长、难度高。大数据收集与处理数据的能力对于零售行业的供应链管理十分有效。零售市场可以利用大数据对库存和员工行为进行监测,从而为管理层做决策提供依据。沃尔玛为了提高大数据成果在不同部门之间的高效利用,并增加存货管理和供应链管理的投入回报率,其开发了RetialLink工具。供应商使用该工具可以预先知道不同店铺商品销售和库存情况,从而能够在沃尔玛发出指令前自行补货,极大地减少商品断货,提高供应链的库存水平[4]。

3传统统计学面对大数据挑战要做出改变

大数据的出现给我们的生活带来了巨大的改变,甚至不同国家的政府都将大数据作为国家的战略资源。相比之下,传统统计学面临着大数据的巨大挑战,如果能根据自身优势做出改变,传统统计学仍然具有存在的价值。第一,改变数据的收集方式。统计学收集数据时前期要做大量的准备工作,需要耗费大量的人力物力成本,所以想要更加高效收集数据,就必须做出改变。由于大数据是基于互联网收集数据的,所以对于不使用互联网的地区和群体来说,大数据就显得很无力,而传统统计学可以在此基础上发挥自身优势,在以往的数据收集方式上进行创新。第二,传统统计学在数据的分析思维上也要进行改变。传统统计学不光要打破只能分析标准化数据的魔咒,更要着重分析问题的本质,而不是一味注重结果分析,虽然“是什么”很重要,但是一直以来探寻事物内在本质才是不断推动人类社会进步的动力所在,所以统计学也要学会知道“为什么”。

4结语

信息技术的发展是无法想象的,我们无法通过今天来预测未来10年信息行业的发展。只有追上时代的脚步,做出顺应时代潮流的改变,才能免遭淘汰,对于传统统计学也是一样,停留在原地不动是不明智的,改变才是世界的本质。而所有技术的变革都将反馈给人类的生活,让人们和社会从中受益。

作者:吴兴蔚 单位:河北省张家口市蔚县第一中学

参考文献:

[1]城田真琴.大数据的冲击[M].人民邮电出版社,2013.[2]维克多•迈尔.大数据时代[M].浙江人民出版社,2013.

统计学大数据分析篇4

关键词:大数据;经管类专业;课程体系

中图分类号:G642.0 文献标志码:A 文章编号:1674-9324(2016)13-0054-02

大数据时代给社会经济发展带来了机遇和挑战,社会各行各业对数据分析需求大幅上升,需要借助数据分析实现数据的增值,挖掘数据背后的潜在价值,为其经营管理决策、投资决策提供智力支持。随着社会经济发展对具有数据管理和数据分析能力的应用创新型经济管理人才的需求逐渐攀升,也引发了对高校经管类专业学生能力的更高要求。面对纷繁复杂的社会经济环境,经管类专业学生必须能够广泛应用定量分析技术,能够从海量数据中获取有效数据,运用科学的方法从这些数据中提取出有用信息,建立相应的模型,作出最优决策。

统计学是培养经管类专业学生定量分析能力的一门重要课程,是众多高等院校经管类专业的专业基础必修课,是以后深入学习相关定量方法类课程(诸如计量经济学、管理运筹学、市场调查与预测等)的基础。因此,统计学课程体系设置是否合理,将直接影响到学生获取有效数据和分析数据应用能力的培养,进而影响学生定量分析能力的培养。

一、经管类专业统计学课程体系存在的问题

1.课程教学定位模糊。我国高等院校经管类专业统计学教学中的最大弊端在于一直按照前苏联划分方式将其归类为一门偏重于简单数据整理课程,而将相应的统计分析所采用方法和理论归为数理统计,因此在教学中不重视对后者的学习。然而,西方发达国家的统计学课程是同时包括这两个部分内容的,尤其是后一个部分内容是定量分析的重要基础。因此,在传统统计学教学定位下,学生只认识了基本理论与概念,却掌握不了处理和分析数据的能力,这与经管类专业应用型人才培养目标相背离,难以适应大数据时代社会各领域对经济管理人才素质的新需求。

2.课程体系有待完善,与经管类专业融合不够。目前,大多数高等院校经管类专业统计学课程设置只涉及理论统计学这一领域,未将统计分析方法与相关经管类专业知识有机结合。在这样的课程体系安排下,学生虽然掌握了统计基本理论和方法,但难以体会到统计在本专业学习中的应用价值,当面临现实的经济、管理问题却无能为力,不会运用所学统计方法,结合专业知识对实际问题进行定量分析。这种状况与经管类人才定量分析能力培养目的相违背,难以实现具有创新能力的经管类人才的培养目标。

因此,如能结合经管类专业特点,对统计学的课程体系进行优化建设,势必能够培养出具有定量分析技能,满足社会需求和企业需求,符合大数据时代人才素质要求的经济管理人才。

二、大数据时代经管类专业统计学课程体系构建

1.明确课程教学定位。目前,统计学教学中偏重于统计学基本概念、基本模型和基本方法的理论知识学习,系统性较强,有利于学生全面了解统计学的知识体系,但是对统计思维能力的培养和统计方法的应用重视不够,这不仅会让学生望而生畏,从而失去学习的主动性与积极性,更为重要的是学生不能够学以致用,在自己本专业深入学习过程中不会运用统计学知识来解决实际的经济管理问题,而在教与学中出现的这些问题源头在于教学定位不够准确。因此,本文提出新的课程教学定位:以应用创新型人才培养为导向,提高经管类专业学生定量分析能力为目标,结合经济学科和管理学科的特点,通过统计学的理论教学、案例分析、课程设计、实验(践)等教学环节,培养学生统计思维能力和统计应用能力,具备运用统计学理论与方法,研究社会经济管理领域有关数据收集、整理、分析等解决实际问题的综合能力,以适应大数据时代对经济管理人才的新需求。

2.课程体系优化建设。根据新的教学定位,统计学课程体系优化建设的基本思路:一是课程体系设置要强调基础知识、注重灵活应用、突出定量分析的教学理念和教学目标;二是课程结构上,突出专业针对性,强调统计学科和经济学科、管理学科的有机结合,使课程特色化;三是建立实践教学体系,加强学生实践能力的锻炼,为学生提供综合素质和能力提高的实训平台;四是将统计分析软件的运用融入到课程体系之中,加强统计分析软件的技能培养。

因此,本文将运用模块化系统集成思想,根据经济与管理类各专业的要求,提出按专业分模块,按模块分层次,按层次定内容的改革方案,构建“课程体系课程子系统课程模块具体内容”的递阶控制结构模型,具体如图1所示。

在统计学课程体系优化建设中,我们运用系统科学的方法构建出模块化、层次化集成的课程体系在整体功能上达到了最佳状态。

课程基础子系统是统计学理论基础和统计思维培养阶段,由统计学基本原理和基本理论构成,体现了“厚基础”的功能。课程应用子系统和课程案例子系统是统计分析能力训练阶段,首先结合认知性案例模块系统介绍统计分析方法,让经管类专业学生了解统计分析方法的基本原理,其次进一步结合专业特色案例模块和统计分析软件模块,通过分专业教学方式,使不同专业学生能够体会到统计学在本专业中的应用,增强学生的学习兴趣,体现了“强能力”的功能。课程实践子系统是统计应用能力实践阶段,是培养大数据时代应用型经管人才的重要环节。课程实践主要包括课堂实践和实验室模拟,课外实践主要包括社会实践活动、实训实习和相关竞赛,通过课程实践和课外实践两大平台训练学生运用所学统计调查、统计整理和统计分析等知识解决实际问题的综合能力。课程选修子系统是统计应用能力扩展阶段,该阶段在学生掌握统计学相关知识的基础上,通过选修统计预测与统计决策两大模块,进一步培养学生的定量分析能力。

三、结束语

大数据时代经管类专业统计学课程体系构建,应注重强化基础理论,突出知识的实用性和创新性,做到统计知识与实例分析相结合,与软件应用相结合,理论教学与实践教学相结合,与实际应用相结合。根据经管类各专业特色,以“知识+能力+应用”模式进行模块化、层次化课程体系设置,从本质上提升学生的数据素养和信息素养,提高解决实际问题的定量分析能力,以适应大数据时代对人才素质的新需求,使具有数据管理和数据分析能力的经济管理人才在就业市场上更具有竞争力。

参考文献:

[1]孙根年.课程体系优化的系统观及系统方法[J].高等教育研究,2001,(2).

[2]曾五一,肖红中、庞皓,朱建平.经济管理类统计学专业教学体系的改革与创新[J].统计研究,2012,(2).

[3]姚寿福.经济管理类本科专业统计学课程教学改革思考[J].高等教育研究(成都),2012,(3).

[4]朱怀庆.大数据时代对本科经管类统计学教学的影响及对策[J].高等教育研究(成都),2014,(3).

统计学大数据分析篇5

以应用型人才培养为导向,独立学院金融专业学生定量分析能力培养的根本目标是提高学生分析和处理金融数据的能力,结合金融学科的特点,独立学院金融专业学生定量分析能力培养的具体目标可以确定为以下三个方面:第一,培养学生收集、描述和展示金融数据的能力。由于收集、描述和展示金融数据是进行金融定量分析的前提,因此这一目标强调建立金融专业学生定量分析能力的坚实基础,是定量分析能力培养的基本目标。第二,培养学生对金融横截面数据的分析能力。由于金融学科特别是现代公司金融领域有大量数据体现为横截面数据;同时,横截面数据也是本科生统计学和计量经济学课程的主要教学载体,因此,这一目标是定量分析能力培养的主要目标。第三,培养学生金融时间序列数据的分析能力。金融的资产定价和风险管理领域有大量数据体现为时间序列数据;但由于本科生统计学和计量经济学课程较少设计时间序列数据的分析教学,因此,这一目标是定量分析能力培养的补充目标。

2独立学院金融专业学生定量分析能力培养的教学设计

独立学院金融专业学生定量分析能力的三个培养目标决定了相应的教学内容应围绕收集、描述和展示金融数据以及分析金融横截面和时间序列数据进行设计,具体地,教学内容可以相应地设计为以下三个方面:第一,通过统计学课程的教学培养学生收集、描述和展示金融数据的能力。由于收集、描述和展示数据属于统计学的描述统计范畴,因而这一能力的培养需要通过统计学的教学来实现,在教学中,以应用为导向,向学生介绍如何通过数据库获取金融数据、如何通过表格、图形和统计量来描述和展示数据;在教学别注意数据库(比如国泰安)和统计软件(比如SPSS)的运用,通过统计学课程的教学使学生建立扎实的数据分析基础,掌握常用数据库和统计软件的基本操作。第二,通过统计学与计量经济学课程的教学培养学生分析金融横截面数据的能力。在教学过程中,一方面通过统计学课程使学生掌握横截面数据分析的基本方法,例如区间估计、假设检验、方差分析、相关分析和线性回归分析;另一方面通过计量经济学课程加深这些方法的理解和运用,特别是拓展对于线性回归分析方法的假设、操作、可能出现的问题及其解决方案的理解。通过这两门课程的结合教学建立学生对金融横截面数据的定量分析能力。第三,通过增加传统计量经济学课程的教学内容或设立专门选修课的方法培养学生分析金融时间序列数据的能力。由于传统计量经济学课程涉及的实质金融时间序列分析的内容较少,而这一部分内容在金融实践中又较为重要,因此可在传统计量经济学课程的教学内容中增加一些金融时间序列分析的应用介绍,比如平稳性检验、协整分析、时间序列分析模型构建等内容,或是将这些内容通过独立设置的选修课进行介绍,以弥补传统教学的不足,完善学生定量分析能力的培养。

3金融专业学生定量分析能力培养的实施:以浙江大学城市学院为例

浙江大学城市学院是一所以培养应用型、复合型、创新型人才为目标的独立学院,也是我国建立最早、知名度较高的独立学院之一。浙江大学城市学院的金融学专业设立3门课程培养学生的定量分析能力:统计学必修课、计量经济学必修课以及金融计量学选修课。三门课程横跨从大二下学期到大三下学期的三个学期,三门课程均以提高学生定量分析能力作为教学的根本目标,并在教学中注重运用软件解决实际问题。因此,研究浙江大学城市学院金融专业学生的定量分析能力培养对研究独立学院金融专业学生定量分析能力培养具有借鉴意义。就教学内容而言,三门课程由同一老师授课以保证教学内容的连续性和教学风格的贯彻,教学内容注重原理解释与软件操作,淡化数学推导与证明。具体地,统计学课程侧重于建立学生定量分析的基本技能,内容主要包括:数据的图表展示与概括性度量、抽样分布与参数估计、假设检验、非参数检验、方差分析、相关分析和回归分析;课程为三学分课程,每周两学时理论课结合两学时上机实验课,课程教学基于SPSS软件,通过软件运用的教学与练习培养学生收集、描述和展示金融数据的能力,建立学生对金融横截面数据的分析能力基础。在统计学课程结束之后即进入计量经济学课程学习,教学内容从回归分析的假设展开,主要包括回归分析估计量的统计理论、回归可能产生的问题及解决方法、以及各类线性和非线性回归的操作;课程为三学分课程,每周两学时理论课结合两学时上机实验课,课程教学在SPSS软件的基础上引入更适合进行回归分析的EVIEWS软件,加强培养学生的金融横截面数据分析能力,并为金融时间序列数据分析能力培养打下基础。在计量经济学课程结束之后学生可以选修金融计量学课程,教学内容侧重金融时间序列分析,主要包括时间序列的平稳性、协整性分析以及金融时间序列模型构建;课程为两学分课程,通过EVIEWS软件时间序列分析模块的教学与实践培养学生的金融时间序列数据分析能力。浙江大学城市学院的金融学专业通过以上三门课程的结合教学培养学生的定量分析能力,掌握SPSS和EVIEWS软件的使用,为毕业论文和之后从事的金融工作打下基础。

4结论

统计学大数据分析篇6

[关键词]工商管理专业;统计学;教材内容

[基金项目]西安邮电大学研究生教育教学改革项目(YJGK201924);西安邮电大学2017年《统计学》教材建设项目资助

[作者简介]吴培乐(1965—),女,陕西渭南人,西安邮电大学经济与管理学院副教授,研究方向为统计学理论与方法;刘飞(1975—),男,陕西西安人,博士,西安邮电大学经济与管理学院副教授,研究方向为统计学和会计学。

[中图分类号]G642[文献标识码]A[文章编号]1674-9324(2020)43-0346-02[收稿日期]2020-03-19

一、我国统计学教材的建设现状及其分类

我国现有的统计教材分为两种类型:一是由全国统计教材编审委员会组织编写的教材系列。这类教材有很大权威性和影响力,是新中国成立后前期统计教材的代表,一直被沿用至今(以下称原有教材体系)。但随着社会经济的发展,这类借鉴原苏联统计体系编写的统计学教材已不能满足新时期的统计工作需求,其市场地位也出现了明显的下降趋势。二是借鉴西方国家统计学教材体系编写的具有新时代特征的统计学教材系列(以下称新教材体系)。

二、我国统计学教材体系与内容设置的主要问题

(一)原有教材体系的特点与不足

原有教材体系以统计总体为主线连接教材内容,各章内容均以统计总体为对象展开阐述,其不足主要有:(1)研究范围和概念界定狭窄。如原有教材体系将变量定义为“可变的数量标志”,即认为只有个体的数量特征才是变量,这一变量概念与新教材中“变量是说明现象特征的概念”相比范围要狭窄的多。(2)统计方法的数理基础介绍较少。现有教材体系中基本不介绍抽样分布及其理论,而是从逻辑分析的角度介绍每个抽样估计公式的结构和形成,不仅难以理解,而且难以达到会一通十的教学效果。

(二)新教材体系的特点与不足

新教材体系以数据为线条连接各章的内容,虽克服了原有教材体系的一些缺陷,但也存在不足之处。具体表现在:1.缺少统计指标的相关内容。统计指标不仅可以反映社会经济运行的状况、过程和结果,而且可用于对社会经济运行的结果进行比较、评估和考核。除此之外,统计中的有些分析方法也是按不同统计指标分别设置的,如果事先不对指标的概念和分类加以介绍,相关分析方法的学习就会出现困难。2.很多基础性的统计方法被删除。如平均发展水平的计算、由相对数和平均数计算平均数等内容在新教材体系中被删除,事实上这些计算方法在实际工作中经常遇到,而且有着特殊的计算思路和方式。

(三)两类教材共同存在的问题

1.抽样推断被归入数据分析部分。抽样推断包括抽样估计和假设检验两部分内容。其在统计学教材中的位置通常是在数据分布特征测定之后,动态数列或相关与回归分析之前,也即被穿插于数据分析方法之间,从而使读者误解为抽样推断是数据分析方法之一。

2.内容多而不精。随着市场需求的变化,统计学教材涉及的内容越来越多,但如果内容增加过多,或不适合本科教学,反而难以取得良好的教学效果。

三、统计学教材体系的重构

(一)构建原则

1.选择合适的主线连接各章内容

一般来说,连接一门教材内容体系的线条应能充分反映该学科的本质特征,并能把全部研究内容有机的连接起来。因此,其确定应从该学科的研究对象和学科性质入手。统计学作为一门研究数据的方法论科学,提供了数据处理各个阶段的一套方法,根据这一内容特点,统计学教材在内容安排上应按数据处理的不同环节为主线安排各章内容,即“数据搜集—收据整理—数据推断—数据分析与评价”等。

2.内容设置与研究对象的内涵界定相一致

任何一本教材都有自己特定的内涵界定与研究范畴。这些范畴所包含的基本概念与研究对象,是教材编写最基本的逻辑分析起点,也决定着教材内容设置的基本框架。因此,统计教材各章内容也应明确的分为品质数据和数值型数据两个部分。

3.章节命名有明确的指向性

在现有的统计学教材中,数据搜集、数据整理部分章节标题都有着明确的含义,主要是分析部分章节标题不太明确。现有统计教材的分析部分基本上是以方法名称作为各章的标题,如综合指标分析法、时间序列分析法、相关与回归分析、统计指数等。

(二)统计学教材体系的重构

根据以上分析,本文提出如下的本科统计学教材内容体系:

第一章导论。主要内容包括统计学的定义、统计学的分科、与其他学科的关系、基本概念、统计分析软件介绍等。

第二章统计数据的搜集。主要内容包括统计数据的计量与类型、统计数据搜集的方式与方法、调查方案的设计、调查数据的质量与要求,特别强调大数据搜集的有关问题。

第三章统计数据的整理。主要内容包括数据的预处理、品质数据的整理、数值型数据的整理、频数分布及其显示、数据整理的计算机操作。本章特别突出运用软件进行数据进行整理,并简要大数据整理的方法。

第四章统计数据的推断。主要内容包括抽样估计和假设检验,并强调在大数据时代推断方法的应用。

第五章数据基本特征分析。主要内容包括数据总量分析、数据对比关系分析、数据集中趋势分析、数据变异程度分析、数据分布状态分析、数据基本特征的显示。本章还将通过实例没演示数据特征测定的计算机操作。

第六章数据变化分析。主要内容包括数据变化分析概述、单一数据变化分析—时间序列分析、多数据综合变动分析—统计指数。

第七章数据相互关系分析。主要内容包括数据相互关系分析概述、品质数据相互关系分析—列联分析、品质与数值型数据相互关系分析—方差分析、数值型数据相互关系分析—相关与回归分析。

第八章数据综合评价与分析。主要内容包括数据综合评价概述、综合评价基本方法、综合评价案例分析。

(三)所构教材体系的特点

1.在体系构架上大胆创新

本体系在吸取两类统计学教材优点的基础上,对统计学教材体系进行了重构。其创新表现在三个方面,一是从广义的数据概念出发,分别介绍品质数据和数值型数据的整理和分析方法;二是把抽样推断的内容从数据分析方法中分离出来单列一章,明确了其数据准备的功能;三是数据分析部分各章以分析内容为依据进行命名,如数据基本特征分析、数据相互关系分析等,带有明确的指向性,便于数据分析方法的选用。

2.在内容设置上突出实用

统计学作为一门工具性的方法论学科内容设置必须实用,本体系在内容设置上充分考虑了这一要求。一是对各类数据处理方法的介绍注重对其操作步骤和实际应用的介绍。统计学涉及的数据处理方法很多,要使学生对每种方法都能清楚的掌握,且能选用的恰当,就必须重视对统计方法的操作过程和应用条件的介绍。二是把理论知识与计算机的应用紧密结合。

统计学大数据分析篇7

统计分析和计算机、互联网的相互结合给我们的生活生产带来了很大的便利,统计学通常是 以足够大量的社会情形做统计研究的,计算机统计分析的飞快发展是非常符合社会发展趋势 的,为了更便利更准确的处理各类数据,人们一直在对其进行深层次的探究,并且将这项技 术方法很好的运用到了科学、社会、医学等各个行业,现在人们可以利用计算机统计分析技 术快速的对所需数据进行处理得出结果,是人类科学历史上的一大飞跃,其发展脚步不容阻挡。

1 计算机与统计分析现代化

1.1 计算机与统计学现代化

统计学主要是通过数据搜集、整理工作将信息归纳分类,给社会经济等问题提供解决方案的 数理依据和基础,统计分析在社会经济问题研究中可以起到很大的作用,在社会经济飞快发 展的过程中,各行各业对信息的需求量越来越大,对各类数据问题处理的渴求度也不断上升, 互联网更是将信息网络化,这些的实现都需要统计学的介入而且在其中发挥重要作用,但是 现代社会信息数据的繁琐量大都不是传统统计学能够做得到的,这时计算机和统计学的有机 结合成就了信息网络化的大数据时代。统计学现代化的实现必须要依靠计算机这一现代化计 算工具的协助,现如今计算机统计已经被广泛普及和利用,与时展进步的趋势相吻合。

1.2 计算机与数据分析处理

传统的人工处理分析数据早已不能满足社会发展的需求,通过其与计算机的相互结合,很大 程度上节省了分析工作的时间精力,同时降低了数据分析处理过程中的错误几率。不仅如此, 可以进行多样化、标准化的数据分析,更加人性化;伴随人类社会的发展,人们对数据结果 的要求愈加严格,这无形之中促进了计算机数据分析技术的进步,推进了数据分析技术普及 各行各业的发展历程。

2 计算机与统计分析

2.1 计算机统计分析的一般方法

很多的数据分析流程软件在国际社会上是相互通用的,SPSS,SAS 等就是比较典型的统计分 析软件,这些软件已经慢慢地在我们国家的经济、教育、医疗等行业之间普及,不同的统计 分析软件表面上有些不同,但本质的分析处理方法不尽相同,步骤如下:

(1)录入数据信息 ;

(3)分析处理计算;

(4)得出结果并保存。

要进行计算机统计分 析首先要进行信息库、数据库的建立,建立之前先进行数据分类以便信息录入,使其进入数 据库中,有利于分析和解决,录入工作人员可以通过一系列计算机的功能应用将数据整理并 分类,计算机分析处理的计算是统计分析的关键所在,统计分析得出的结果可由图像或文字 表达出来,举个例子:图形分析水平较高的软件有 SPSS 等。计算机统计分析的最终目的是 为了得到正确的剖析结果和分析解释,这是重点同时也是难点,有待我们去创新提高。

2.2 计算机在统计分析中的重要作用

新形势下,社会生产经济的发展异常迅速,大数据的时代已经到来,信息量的急增,内容复 杂程度的增加传统的统计分析效率早已满足不了社会发展需求,在这场计算机和统计分析的 结合中,人们的生产生活发生了翻天覆地的变化,计算机起到了至关重要的作用。第一,计算机取代了传统的统计分析员,符合社会生产快速发展的需要,在数据量庞大、信息极度复 杂的情况下,计算机的超强计算能力真是如鱼得水,协助统计分析促进了人类社会的进步。 打个比方,投资者想要进行理财投资,想要挣钱的几率大一些,这时他就完全可以借助计算 机进行统计分析,能够很快很准确的得出结果,很大程度的提高了理财挣钱的几率。

2.3 数据统计分析中计算机的应用

计算机被运用到数据统计分析当中去主要是因为其强大的计算能力,人们只需要告诉计算机 要统计什么信息或者什么数据,需要哪个方面的分析结果,需要怎样的数据处理结果,这些 都是简单易于操作的问题,而最难的计算部分则由计算机这个“超强大脑”来解决,这不仅 节约了大量时间,还能减少错误的出现。我国的计算机技术在国际上不是很先进,我国自主 研发的一些计算机统计分析软件规模小、漏洞多,还要继续努力研发编程出可以与西方发达 国家相媲美的统计分析流程软件;另外还得加强操作人员的实际操作能力,选择适合自己的 统计分析软件进行数据分析处理,这是由于每个人对不同软件的操作实践程度不同造成的, 比如:EXCEL 和 SAS 软件的不同,也就有不同的操作员利用它来做同一件事,计算机的统计 分析。

3 如何利用计算机做好统计分析

做好计算机的统计分析工作属实不容易,首先,学习统计、分析原理知识,加强对分析处理 原理理解,将基本分析流程掌握透彻,注重各个分析处理过程中的细节部分;其次,软件的 选择也很重要,软件的理解掌握程度因人而论,在软件选择使用过程中,可以从入门到深入, 逐步利用计算机做好统计分析。

4 结语

在未来的日子里,计算机统计分析会更加深入的渗透到我们的生产生活中来,计算机和统计 分析是密不可分的;另外,我们国家的软件开发水平还达不到国际尖端水平,规模性、完整 性和规范性都还有很大的提升空间,让我们一起为我国的计算机统计分析事业努力钻研,创新进步。

参考文献

[1]杨坚白.统计分析的意义和特点[J].统计工作通讯,1956(10).

[2]杜慎仲.统计分析中存在的问题及对策浅议[J].发展研究,2002(03).

统计学大数据分析篇8

关键词:EXCEL;统计学教学;图表;函数

一、统计学教学面临的困境

就目前来看,有一部分同学进入大学校园,数学是其中的一门弱势学科,统计学的一部分计算以数学为基础,很多学生对统计学的学习产生了畏惧心理,从而忽视了这门实用性较强的学科。在现行的高职统计学的教学过程中,理论讲述,公式推导占据了很大部分的比重,案例较少,学生感觉比较枯燥,统计计算仍以_手工计算和半手工的计算器为主,从很大程度上挫败了学生学习的积极性。如果把EXCEL应甩到统计教学当中去,就会把复杂的问题变得简单,解决了同学们在计算上的软肋,提高大家的学习兴趣,会达到事半功倍的效果。

二、利用ExCEL作为统计学学习工具的优势

首先EXCEL软件安装简单,便于操作。对于EXCEL来讲,是常用的办公软件,安装便利,在学生进入大学阶段之前就已经接触EXCEL并且已经具备一定的基础。在大一的上半学期,很多同学就对EXCEL进行过详细系统的学习,相比SAS,SPSS这些统计软件来讲,EXCEL软件更加容易被学生接受。

其次EXCEL具有强大的数据分析功能。Excel提供了多种数据分析手段,从函数、分析工具库、加载宏等,一直到数据透视表和数据透视图。让我们对数据进行归纳后,能够利用这些函数和图表对数据进行分析,有利于提高学生的数据分析能力。

三、EXCEL在统计教学中的具体应用

(一)EXCEL主要的统计功能

1.图表功能

EXCEL总共包括了14种类型的图形,包括柱形图、条形图、折线图等,图表具有较好的视觉效果。

2.数据分析工具

在EXCEL数据工具分析库中,有19种数据分析工具,这些统计分析工具,使EXCEL具备了专业统计分析软件的某些功能。

3.公式与函数

函数的使用,提高了运算速度,EXCEL提供了涉及不同领域的函数,使用函数进行运算可以提高运算速度和准确度。

4.VBA编程

可以利用VBA宏语言进行编程,自行撰写函数公式,为特定的任务制作方案。

(二)EXCEL在统计学教学中的应用实施

整个统计研究的全过程分为四个基本环节:统计设计,统计调查,统计整理,统计分析。其中统计设计贯穿于各个统计环节当中。作为统计学教学来讲,一般统计学的教学就是按照各个环节的展开,而EXCEL在统计调查,统计整理和统计分析的过程中都有所涉及。

统计调查阶段是统计工作的起点,其主要任务是收集反映调查单位特征的数字和文字资料的工作过程。我们可以把搜集到的原始资料采用EXCEL的形式进行记录,这样比较直观整齐,因为EXCEL可以实行自动快速的统计,我们可以利用求和、计数、均值、最大值、最小值等自动计算功能进行计算。统计调查一种常用的方法是问卷调查法,我们可以把我们设计的问卷录入EXCEL,对各选项进行编码,便于以后利照EXCEL的编辑替换,以及数据透视表透视图等功能对问卷进行整理分析。

在统计整理阶段,最常用的功能是统计图的编制,统计图具有形象直观、一目了然的优点。我们可以把原始数据输入电子表格。在插入菜单中选择图表选项,然后选定图表类型,确定数据范围,经过一系列的调整,得到自己心仪的图表,减少了手工绘制的麻烦。

在统计分析阶段,EXCEL的应用更加的广泛。首先对于静态指标的计算尤其是平均指标的计算,函数功能在此显得尤为重要,我们可以利用AVERAGE函数来计算算术平均数,利用HARMEAN函数来进行调和平均数的计算,利用MEDIAN进行中位数的计算,利用STDEV进行样本标准差的计算,大大提高了计算的效率。同样EXCEL的公式与函数功能可以很好地应用于动态分析,指数分析,以及抽样推断中。

EXCEL在统计学教学当中有着非常重要的作用,把EXCEL适当的应用于统计教学当中去能够大大提高学生们的主观能动性,提高学习效率,使学生能够利用现代分析工具对社会现象的发展变化情况进行分析研究。

参考文献

[1]中兆光.EXCEL在统计学教学中的应用探讨现代商贸工业,2008

统计学大数据分析篇9

关键词:大数据;统计学;统计思维;数据应用模式;数据分析 文献标识码:A

中图分类号:C829 文章编号:1009-2374(2015)09-0048-02 DOI:10.13535/ki.11-4406/n.2015.0779

1 对大数据的初步认识

首先我们需要知道什么是大数据,它在不同的科学领域、不同的行业都有不同的解释。相对于传统意义上的数据,大数据这里的含义有新的解释,不只是字面本身的意思,更为重要的是数据的内涵,可能“大”与“数据”的含义本就不能分开理解,只有把“大数据”这三个字放在一起才能更有意义。从统计学的角度出发我们应该怎样来理解大数据呢?它是在现代信息技术、工具的基础上运用可自动记录、储存能力的所有类型的数据。简单地说,大数据就是所有的可记录信息的集合。可以这样来理解,把以前的统计研究数据比做是根据一定条件收集在一起的结构化的样本,那大数据就是所有可以记录、存储、超大容量的各种各样类型的数据总集合。从统计学的角度出发,传统的样本数据与现今的大数据的区别在哪呢?区别就在于传统的样本数据是按特定的条件所产生的格式化数据,样本的数量是有限的,而且如果说统计设计过程偏离了方案,数据就失去意义。一般都不可能同时满足各方面统计需求,如果出现了其事先未考虑到的情况,数据的不能扩展性就会导致数据的失效,那统计方案也就失效了。而大数据是所有可能通过现代信息科技手段可获得的数据,其数据量巨大,并且不会受到一些条件的限制。因此,大数据最大的优势就是非常宽的数据选择性,可进行多维度、多角度的数据分析方案。更为重要的是因为大数据的样本选择面宽,样本如果不够说明情况还可以从大数据中选择扩大;样本中不能够发现的某些细小信息,在大数据也可以获得。

2 统计思维的新变化

在大数据时代要想做好统计工作,需要改变统计思维,否则,统计工作很难发展,至少会被边缘化。统计思维的变化应该从对数据的掌握与分析开始,下一步是揭示事物的本质与相互联系,直至揭示事物的发展规律。也可以说统计工作的目的就是要还原事物的本来面目,从而达到还原真相的效果。

2.1 认识数据的思维要变化

与传统样本数据相比,大数据不仅数量多和选择多,而且其来源和数据类型都发生了根本性的变化,数据既杂乱又多样。首先,从根源来讲,传统的样本数据的收集对象较特定,所以数据的特征都非常明显并可以识别,还可以进行事后的核对检验。但大数据则不同,它们来源于网络,其数据并不是为了特定事物收集而产生的,而是一切可记录的数据,所以说大数据的来源是没有针对性的。其次,从类型来看,传统样本数据一般都是结构型数据,有一定格式标准,可以运用常规统计指标或者统计图表来表示。而大数据大多是非结构型且无任何针对性的数据,既包括可记录的和可存储的信号,又没有标准、多样化,过去的统计指标或图表来表现比较困难。最后,从运用方式上看,传统样本数据的处理有一整套方法可行,其结果可以直接使用。但是大数据中的数据怎样与结构化数据对接则是一个崭新的问题。

2.2 收集数据的思维要变化

以往收集统计数据的方法是先确定统计研究目的,再根据统计目的收集数据,因此设计调查方案及设计统计流程就显得十分必要,有时投入的人力物力较大而产出数据十分有限。现在则不同了,在大数据时代,有大量的可选择数据,需要做的环节就是加以比较与筛选,我们需要考虑的应该是怎样利用大数据的优势,在大数据源中找到我们需要东西。当然,也不是所有数据都可以从互联网中找到,中间存在一个再加工或成本比较的问题。所以,有时运用大数据的同时也需要采用一些传统的统计方法来收集特殊的数据,再利用互联网信息技术的强大功能去收集一些相关的数据进行过滤、选择。

2.3 对数据的分析思维要有新变化

针对上述两方面内容发生的变化,对统计数据分析的思维必然要做出调整,这就需要我们尽可能地利用信息技术或先进的技术方法从大数据中找出对我们有价值的信息,并在这个过程中丰富统计科学的方法。主要体现在以下三点:

首先,过去的统计分析方法是先定性,再定量,最后定性。它的意义是为了找准统计方向和目标,运用的是以往经验的判断,这些在以前统计数据分析手段方法较落后的情况下是很重要的。而在信息时代,我们只需要在大数据中找出相应的资料,直接依靠数据分析方法做出统计判断,这种方法在存储能力无限增大、统计分析方法和实现速度大大改善的现在,已经变得可以实现了,因此我们更需要做的就是直接从中找出真正需要的数据,就可得出我们所需要的内容,因此统计分析的整个流程可直接简化为先定量、后定性。

其次,过去的统计样本实证分析,都需要先依据统计目的提出设定,再通过数据收集与分析来证明是否成立,但是这种验证过程往往受到局限,特别是一旦假设不科学、不符合实际情况,那么分析的结论就没有意义甚至歪曲事实。许多例子分析目的就是为了凑合假设。反之,在大数据时代,可以先不考虑任何条件和限制去寻找关系和发现规律之后再加以总结并做出结论。统计分析的思路则是发现、总结。这样一来,就丰富了统计分析的资源和空间,有利于发现其他更有益的数据。

最后,统计推断分析理论,是基于分布理论原理,以数学中的概率做基础,再根据样本的特征推断出总体特征。其逻辑关系为先分布理论,然后是概率考证。标准虽然与样本无关,但是推断的是否正确却是决定于样本的质量。在大数据条件下,总体特征就不再需要根据分布理论来进行推断了,如果需要的话进行计数即可根据所有数据以及实际分布的情况来推断其中某些可能,那么其逻辑就变成了实际分布情况、总体特征和概率推断。

3 结语

大数据时代对人类社会政治、经济、文化产生着深远的影响,特别是对国民经济统计科学的变革产生着直接的影响。我国统计机构和统计人员如果忽视或者回避这种影响,就很难适应时代的发展,也就不能良好地完成统计工作。大数据时代已经到来,我国统计机构要端正态度、放眼未来,率先在统计制度和方法上做出改变,才能使统计科学的意义得到保证。

参考文献

[1] 涂子沛.大数据[M].桂林:广西师范大学出版社,2013.

[2] 郭晓科.大数据[M].北京:清华大学出版社,2013.

统计学大数据分析篇10

关键词: Excel应用程序 运用 英语考试成绩 分析

引言

通常在工作中,经常会用到Excel应用程序进行筛选、排序、求平均值及插入图表等。本文主要讲述Excel “分析工具库”加载宏中提供的一组数据分析工具(称为“分析工具库”),如描述统计工具、排位与百分比、直方图工具、积差相关描述等,在帮助建立复杂统计或具体分析时可节省不少的步骤。以某班级某次英语考试成绩为例,我们利用上述四种工具对该成绩表进行分析,并得出一些合理的结论。

要查看可用的分析工具,请单击“工具”菜单中的“数据分析”命令。如果“工具”菜单中没有“数据分析”命令,则需要安装“分析工具库”。安装“分析工具库”步骤如下:

1.在“工具”菜单中,单击“加载宏”命令。

2.选中“分析工具库”复选框。

一、描述统计工具

1.统计描述

“描述统计”分析工具用于生成源数据区域中数据的单变量统计分析报表,提供有大数据趋中性和离散性的综合信息。

对于一组数据,要想获得它们的一些常用统计量,可以使用Excel提供的统计函数来实现。例如AVERAGE(平均值)、STDEV(样本标准差)、VAR(样本方差)、KURT(峰度系数)、SKEW(偏度系数)、MEDIAN(中位数,即在一组数据中居于中间的数)、MODE(众数,即在一组数据中出现频率最高的数值)等。最方便快捷的方法是利用Excel提供的描述统计工具,它可以给出一组数据的许多常用统计量。

2.操作步骤

打开“工具”―单击“数据分析”―选中“描述统计”―按选项中要求操作,最终确定即可。

汇总统计结果可以包含:平均值、标准误差(标准误)、中值(中位数) 、模式(众数)、标准差、样本方差、峰值(样本峰度)、偏斜度(样本偏度)、区域、最小值、最大值、总和、计数、第K个最大值、第K个最小值、置信度。

3.操作结果(如图所示)

4.结果分析

“总分”项的平均分为72.7642857,标准误为0.77236974,中值为73.5,模式为70,标准偏差为6.46210886(注意:此处是估算的标准差,而非计算的标准差。计算的标准差应为:6.415784903),样本方差为41.7588509,峰值(峰度)为-0.1489733,偏斜度(偏度)为-0.2945057,全距(区域)为29,最低分为57,最高分为86,分数总和为5093.5,有效数据为70个。从峰值-0.1489733和偏斜度-0.2945057都非常接近于0这一点,可以判断这些数据来自一正态分布总体(或可以说:该总体呈正态分布①)。

二、排位与百分比排位

此分析工具可以产生一个数据列表,在其中罗列给定数据集中各个数值的大小次序排位和相应的百分比排位,用来分析数据集中各数值间的相互位置关系。分析该次测验中每位学生在班级中的成绩排名和相应的百分比排位,得到操作结果如下(本处篇幅有限,只选前面8名的数据):

三、直方图

1.直方图的意义

直方图中小矩形的面积就等于数据落在该小区间的频率f/n。由于当n很大时,频率接近于概率,因而一般来说,每个小区间上的小矩形面积接近于概率密度曲线之下该小区间之上的曲边梯形的面积。所以,通常直方图的外轮廓曲线接近于总体x的概率密度曲线。这样直方图就直观地给出了数据的统计特性和分布情况。

2.操作步骤

打开“工具”―单击“数据分析”―选中“直方图”―按选项中要求操作,确定即可。

3.操作结果(如图所示)

4.结果分析

从峰值和偏斜度都非常接近0这一点可以判断该总体呈正态分布。但是仔细分析表中最高频率(图中红色部分)出现在平均值(图中黄色部分)的右侧,由此可见数据呈负偏态分布,说明试题难度偏低,难度较低的项目比例偏大。呈这种分布的试题有利于将成绩较差的学生和中等程度的学生区别开,但不利于将中等程度的学生和成绩优秀的学生区别开。

四、积差相关描述

1.积差相关描述

该工具能够帮我们得到一些相关系数,从而分析数据之间的相关系数。比较各个相关系数,可以帮助我们从中找到一些规律,来指导我们的教学和科研。

2.操作步骤

打开“工具”―单击“数据分析”―选中“相关系数”―按选项中要求操作,确定即可。

3.操作结果

4.结果分析

从上表中可以看出,“听力”与“总分”的相关系数达到了0.784017,“词形变换”与“总分”的相关系数达到了0.5940568,我们就可根据这个发现各题型之间各占总分的比例。

结语

在教学管理过程中,各个班级的考试成绩的统计和管理、试卷难度分析,都是举足轻重的环节。在这些过程中,我们经常碰到的数据统计分析问题及绘制图表等,需要进行大量而繁琐的数据处理。Excel不仅能够方便地处理表格和进行图形分析,更重要的是它拥有对数据的自动处理和计算的强大功能,可以方便地用于教学工作的数据处理、管理班级成绩、检测试卷难度和区分度,使对学生学习成果的检验更加科学、客观,从而更加有利于促进将来的教学工作。

注释:

①正态分布:如果分数呈对称性分布,其平均数、中数和众数是重合的。一旦三者错开,则表明分数偏离对称分布.

参考文献:

[1]张伯懿.统计学原理[M].北京: 中国石化出版社,1997.9:239-244.

[2]周复恭.应用数理统计[M].北京:中国人民大学出版社.1989.9:378-391.

[3]谢明文.关于协方差、相关系数与相关性的关系[J].数理统计与管理,2004,23,(3):33-36.

[4]微软公司,Microsoft Excel 2002 标准教程(教师手册)[M].北京:中国劳动社会保障出版社,2002.2.

[5]许飞琼,曾玉平.统计学.中国统计出版社,1995.

[6]夏金成.英语学习动机和态度与学习成效的关系研究[J].湖南第一师范学报,2005.Vol.5 No.1.

[7]王汉澜.教育测量学.河南大学出版社,1987.

[8]暨南大学《教育测量》研究组.关于考试的科学化和标准化问题.

[9]王孝玲.教育统计学.华东师范大学出版社,1986.

[10]金玉章.实用教育统计与测量.教育科学出版社,1988.

[11]于信凤.考试学引论.辽宁人民出版社,1987.