数理统计课程应用统计学探讨

时间:2022-10-18 10:35:09

数理统计课程应用统计学探讨

摘要:本文旨在对应用统计学专业中数理统计课程的现状进行分析,针对目前该课程教学过程中存在的问题,通过引入Python软件对各主要知识点内容进行实现,并从教师队伍、实践教学和过程化考核等方面给出课程改革的几点探索,以提高学生学习兴趣、加深学生对知识内涵的理解、培养学生实践和解决实际问题的能力,更高质量地落实应用型人才的培养。

关键词:数理统计;应用统计学;Python程序设计语言;人才培养

随着科技的快速发展,数理统计在自然科学、工程技术、管理科学及人文社会科学中得到越来越广泛应用。对于该课程传统的重理论轻应用的教学模式已不能适应时代的发展和社会对人才的需求。应用型人才的培养已成为新时代人才培养的风向标,结合大数据时代现状的发展需要,培养数理统计分析处理方面的人才更是大势所趋。数理统计作为数学的一个分支,其以概率论为基础,研究大量随机现象的统计规律性,由于计算机的广泛应用使得数理统计在理论研究和应用已渗透到许多科学领域,并已成为科学研究不可缺少的工具[1]。但是,当前数理统计课程教学过程中与计算机技术的结合却存在严重的问题。为了提高教学效果、培养学生动手操作能力,将当前主流计算机语言用于在应用层面揭示各数理统计知识点的内涵,并使得学生能够熟练使用计算工具处理具体的数理统计问题,进而对该课程的教学改革进行探索,以实现应用型人才的全面培养是当前该课程面对的首要问题。

一、数理统计课程现状分析

本文以应用统计学专业为例,结合多年教学经验对数理统计课程、教学现状、课程工具以及存在的问题进行简单介绍分析。

(一)数理统计课程简介

数理统计课程作为应用统计学专业的学科基础与专业核心课程是多元统计分析、贝叶斯统计、非参数统计和数据挖掘技术与应用等课程的基础。应用统计学专业旨在培养人格健全、统计学基础知识与基本方法理论扎实、数据处理实践能力强、勇于创新,能在工程、经济、管理、商务等领域从事数据采集、清洗、整理等实际工作,解决数据挖掘与分析中涉及的复杂统计方法问题的高素质应用型人才。而该课程是在概率论的基础上对于统计知识的深入详细讲解,主要涉及统计量与抽样分布、点估计、区间估计、假设检验和分布的检验等内容。该课程主要是为了使学生了解并掌握数理统计学的基本思想、理论和方法,初步学会在实际工作中实现对数据的处理与分析。

(二)数理统计课程现状

该课程是数据统计分析的基础,大多数高校的相关专业针对学生数据统计分析知识的传授和能力的培养主要通过概率论与数理统计这一门课来实现基础内容的讲解,而将概率论(48学时)和数理统计(48学时)分别单独课设主要在统计学相关专业居多。不论是从课程的单独开设,还是课时的安排都足以体现出该课程对于统计学专业学生的重要性。但是在高校的教学过程中发现,学生对该课程重要性的认识不足,仅把该课程看作是一般的公共类数学课,对自己的要求只是考试通过的层面,并没有把该课程当成统计专业的重要基础课程,也并未意识到该课程的内容会高频率的出现在后续的专业课中,从而很大程度上影响了学生的学习热情和积极性。另外,由于该课程内容抽象,且包含了大量的复杂理论,使得教学难度较大,并且学生的数学基础较差,理解能力也存在差异,从而加大了学生的学习难度。并且,大多数该课程的教学只是对理论知识进行讲解,虽然也有很多人意识到需要将计算机软件实现和应用环节的教学相关结合,但是在实际教学过程中并未真正落实。依然给学生留下了枯燥乏味的印象,使得学生无法直观形象的理解知识点的本质内容和应用场景,也不利于应用型人才的培养。

(三)课程工具使用情况

虽然当今国内众多高校在教学过程中逐渐意识到,理论性较强的专业基础课的重要性,并且想要实现快速计算、良好的可视化和教学效果,必须将其与实际应用背景以及较好的计算工具相结合,以提高学生学习兴趣的同时,使得学生深刻理解知识点的应用场景和具体操作。但是,对于数理统计相关知识的教学较多的仍然在使用SPSS、Mathematica、MATLAB和R等传统统计工具和分析软件[2-5],也有部分教师考虑到Python软件的简洁清晰,功能强大且容易上手,可视化功能强大等优势,将其用于教学活动作为计算工具[6],但是其重点却在概率论部分。

二、Python在课程教学过程中的作用

在应用统计学人才培养方案中,Python程序设计语言是在数理统计课程之前课设的计算机语言课程,并已成为应用统计学专业所需的主流语言软件,该软件工具广泛应用于统计分析、数据挖掘、机器学习和大数据可视化等专业方向课程内容的实现,在应用统计学专业人才培养过程中起着重要的作用。并且将数理统计课程与Python和应用统计学专业方向课程有效接轨,培养学生的学习热情、激发学生的学习兴趣,使学生能更好地理解数理统计知识并能熟练使用Python实现相关统计问题,从而保证人才培养过程的延续性。

(一)Python语言的特点

Python程序设计语言作为数据统计分析的流行语言,其在数据挖掘和机器学习等数据统计分处理方面有着很好的优势,其主要特点有:(1)Python是一门跨平台、开源、免费的解释型高级动态编程语言,是一种通用编程语言;(2)Python语言语法简洁清晰,功能强大且易学,最重要的是拥有大量的几乎支持所有领域应用开发的成熟扩展库;(3)Python语言除了可以解释执行以外,还支持命令式编程和函数式编程两种方式,完全支持面向对象程序设计;(4)Python功能强大,可以实现C、C++和Matlab等多种不同语言的程序融合到一起实现无缝拼接,更好地发挥不同语言和工具的优势,以满足不同应用场景的需求。鉴于Python程序设计语言的各种优势,已广泛应用于统计分析、科学计算可视化、人工智能、机器学习、数据爬取与大数据处理等多个专业和领域。

(二)Python在数理统计课程教学过程中的应用

Python作为一种被广泛使用的免费开源软件,将其应用于数理统计教学全过程,对各个知识点内容进行实现,使得学生更好理解知识点的内涵本质。(1)统计量与抽样分布:当讲授统计量时,可以通过Python语言导入第三方numpy模块重命名为np,即命令:importnumpyasnp,并调用函数np.mean()、np.var()、np.std()、np.corr()求得总体或者样本均值、方差、标准差、相关系数矩阵等,编程实现不仅可以提高计算效率还可以加深学生的理解。也可导入matplotlib.pyplot模块对于常见抽样分布作图,使学生直观感受分布的特点。(2)点估计:主要包括:矩估计、极大似然估计,可通过自定义函数实现极大似然估计的求解,例如设总体X~Nμ,σ2(),x1,x2,…,xn()是来自总体X的一组样本值,可通过Python模拟服正态分布的数据,然后使用sympy库和numpy中prod函数得到似然函数,并通过sympy.log()去自然对数、sympy.diff()求偏导数,然后求解sympy.diff()得到总体中参数μ,σ的极大似然估计。(3)区间估计:对于参数的区间估计,其本质是希望给出参数取值的一个范围,并确定该范围包含参数真值的可靠程度,该范围通常以区间形式给出。因此,对于不同的正态分布、T分布和χ2分布均可调用scipy.stats.norm.interval(confidence,loc=sample_mean,scale=sample_std)实现,其中输入参数包括置信度(confidence)、样本均值(loc)、样本标准差(scale)和自由度(df)可根据具体分布确定是否省略。(4)假设检验:关于假设检验问题主要包括:步骤1:确定问题,其中包括确定原假设(H0)与备选假设(H1),然后根据问题背景和样本数据特点判断假设检验类型,进一步根据抽样分布类型和假设检验的方向;步骤2:在原假设成立的情形下,计算所选的检验统计量和p值;步骤3:根据显著性水平α大小以及检验方向,做出是否接受原假设的判断。例如方差σ2未知时,均值的单边检验问题,即H0:μμ0,H1:μ<μ0,可考虑使用统计模块(stats),并调用单独样本t检验函数stats.ttest_1samp(data,pop_mean),其中输入参数data表示样本数据集,pop_mean表示总体均值μ0,该函数将返回输出参数t表示检验统计量的值和双尾检验的p值,进而确定单位检验的p值与显著性水平α进行比较,从而做出判断。(5)方差分析:方差分析(AnalysisofVariance,ANOVA)又称“变异数分析”或“F检验”,是由Fisher提出的用于两个及两个以上样本均数差别的显著性检验,其原理是认为不同处理组的均数间的差别基本来源于组间差异和组内差异。对单因素方差分析,在满足独立、正态、方差齐性的前提条件下,可用scipy库,并通过输入参数为样本数据的函数stats.f_oneway(),可得到F值和p值,然后与查表得到的原假设下检验问题的临界值作比较,若F值大于等于检验临界值,则拒绝原假设H0,否则接受H0;对于双因素方差分析,基本思想和方法与单因素的方差分析相似,在同样的前提条件下,可从statsmodels.stats.anova中导入用于多因素方差分析的函数anova_lm()可得到方差分析表,进而用于对检验进行判断。

三、课程教学改革

在数理统计课程中引入Python软件对重要知识点进行实现是应用统计学专业课程改革的一部分,关于该课程更全面高效的改革还可从以下几个方面开展:

(一)教师队伍改革

应用统计学专业人才培养过程中不仅要加深学生对理论知识的理解,更要注重对学生利用所学方法解决实际问题的能力的培养,重点在应用能力和创新能力的培养。因此,在此基础上加强统计学专业教师队伍建设工作,特别是Python软件操作能力,案例挖掘能力和数理统计知识点与Python软件的融合能力等方面的改革工作,应多鼓励教师队伍走出去多与企业多交流,了解企业对人才的需求进一步调整改革教学及学生技能培训的侧重点。另外,引入新的教学方法和先进教学理念,以提高课堂教学的质量真正将应用型人才培养落到实处。

(二)加强实践教学改革

根据人才培养方案的要求,学生不仅要掌握数理统计课程中的理论知识,更重要的是要能够将所学知识用于解决实际问题。因此,为了更好地实现教学目标,适量增加上机实验课对培养学生利用Python软件解决实际问题的同时,还能培养学生的动手能力,为后续专业方向类课程打好坚实基础。

(三)优化考核方法

数理统计课程的期末考核方法目前大多数都是闭卷考试,其中主要题型包括:选择题、填空题、简答题和应用题。学生的最终成绩由平时成绩(30%)和期末卷面成绩(70%)。为了实现科学且过程化考核,考核可细分为平时成绩(30%)、实验成绩(20%)和期末卷面成绩(50%),其中实验成绩部分主要考查学生的实验操作技能的掌握、操作的规范性、实验报告格式的规范性、结果的正确性和描述的严谨性。通过全过程化考核方式既能考查学生的平时课堂表现,也能通过实验课程成绩评价学生使用Python软件解决实际的能力,还能客观公正地评价学生对理论知识的理解和应用能力。

四、结语

数理统计课程作为应用统计学专业的基础课在整个人才培养中有着重要的地位。因此,本文主要通过引入Python软件实现对数理统计课程的教学改革,首先对该课程的特点、现状以及教学过程中存在的问题进行简单分析;然后,对Python软件的特点以及结合教学过程中的经验对Python软件与知识点的融入进行了详细的介绍,给出课堂教学改革的切入点和问题求解的过程;最后,从教师队伍建设、实践教学改革和课程考核方式等方面给出该课程的改革意见。通过一系列的改革举措的落实提高学生学习兴趣的同时,加深学生对知识理解,培养学生的应用能力和操作能力,从而真正落实应用型人才的培养。

参考文献:

[1]陈希孺.本世纪以来数理统计发展的历史和现状的若干问题[J].华中师院学报(自然科学版),1980(01):83-89.

[2]李荣华,姜英,吕炜,等.变量间的相关系数及其SPSS中计算[J].教育现代化,2020,7(21):107-108.

[3]解博丽,雷英杰,杨丽,等.概率论与数理统计引入MATLAB实验教学手段的必要性[J].教育教学论坛,2020(23):280-282.

[4]章美月.基于Mathematica的《概率论与数理统计》课程教学改革探索与实践[J].大学数学,2020,36(05):49-56.

[5]汪浩,李莹.大数据/人工智能背景下IT专业基于R的概率论与数理统计教学改革[J].计算机教育,2021(03):180-184.

[6]王福顺,董淑芬,孙小华,等.Python赋能概率论与数理统计教学与实践[J].中国多媒体与网络教学学报(上旬刊),2021(03):218-220.

作者:丁毅涛 任水利 单位:西京学院理学院