数学评价论文十篇

时间:2023-04-04 05:49:48

数学评价论文

数学评价论文篇1

评价是教学活动中常用的一种手段。小学数学的解题评价是实施

数学学习评价的重要组成部分。解题评价是向学生反馈学习情况的一种形式,是帮助老师、家长全面了解学生学习情况的一种手段,目的是激励学生的学习热情,促进学生的全面发展。

《数学课程标准》指出“评价的主要目的是为了全面了解学生的数学学习历程,激励学生的学习和改进教师的教学;应建立评价目标多元、评价方法多样的评价体系。对数学学习的评价要关注学生学习的结果,更要关注他们的学习的过程;要关注学生数学学习的水平,更要关注他们在数学活动中所表现出来的情感与态度,帮助学生认识自我,建立信心。”因此,小学数学的解题评价应充分关注学生的个体差异,发挥其导向、调控、激励、诊断等功能,促进学生全面、持续、和谐地发展。

二、解题评价的内容

小学数学解题评价的核心内容是评价小学生的数学解题能力。具体内容是评价解题思路、解题方法、解题过程、解题结果。

1、解题思路合理与否。对解题思路的评价是一种较高级的思维活动。它是依据一定的评价标准,对各种解题思路权衡比较、全面剖析而作出某种判断的复杂思维过程。注重培养学生对解题思路的评价能力和习惯,就可使学生不仅知其然,而且知其所以然;不仅仅是多学到一种解法,更重要的是站在评价水平的高度上思辨问题。一般说来,凡解题思路合理,即为正确。这是思路评价中的最基本标准。

2、解题方法独创与否。看看哪些解法与众不同,别出心裁。

在正确、合理的思路中选择出比较简捷的解法,剔除那些过繁过难的罕见解法或司空见惯的一般解法。

3、解题过程简捷与否。看看解题过程是否简捷,剔除那些繁难的过程。

4、解题结果正确与否。看看解题结果是否正确。一般说来,解题结果正确与否不作为评价解题是否正确的唯一标准,也不作为评价解题是否正确的主要标准。这是解题评价中的最基本标准。

三、解题评价的形式

解题的评价形式通常不外乎下列四种:

1、教师对学生的评价教师对学生解题的评价包括定性和定量两个方面。定性评价,主要指言语褒贬,应努力挖掘学生解题中的闪光点,在坚持实事求是的前提下讲究评价语言的艺术性——做到褒中有贬,贬中有褒,把握分寸和技巧,使学生心悦诚服。定量评价,主要出现在作业和试卷上,一般来说,定量的评价既要严格又要灵活,对于后进生要尽量宽容,不宜太苛刻,要用发展的眼光看待学生的进步。

2、学生对学生的评价既可以同桌互评,也可以四人一小组讨论,还可全班选代表。这是老师用得较多的形式。

3、学生对自己的评价学生个体的自我评价,是最高形式的鉴赏活动。因此,教师的着眼点应较多地投入到培养学生的自我评价能力上去,通过激发评价兴趣,培养评价习惯,进而提高评价水平。可以说,学生自我评价水平的提高,就反映着解题能力的提高,但解题能力提高,并不等于自我评价能力也得到相应的提高了。

4、家长对学生的评价家长对孩子的期望值较高,因此家长对学生的评价宜坚持客观评价为主。

四、解题评价的原则

对学生解题的评价,既要关注学生知识和技能的理解和掌握,更要关注学生技能的形成和发展;既要关注学生解题的结果,更要关注学生学习的过程中的变化和发展。

笔者认为解题评价的过程中要坚持以下四个基本原则:

1、判断性原则恰当判断学生对基础知识和基本技能的理解和掌握速度。“判断性原则”应遵循《课程标准》的基本理念,以学段的知识与技能目标为标准。应该强调的是,学段目标是学段结束时学生应达到的目标,应允许一部分学生经过一段时间的努力,随着数学知识与技能积累逐步达到。因此,教师可选择“推迟判断法”评价方式。如果教师对某次学生的解题觉得不满意,可允许学生重新解答。

当学生通过努力后,改进原解题的错误后,教师可给出鼓励性评语。这种“推迟判断法”评价方式淡化了评价的甄别功能,突出反映了学生的纵向发展。特别是对学困生而言,能让他们看到自己的进步,感受到获得成功的喜悦,从而激发新的学习动力。

2、激励性原则目的以激励为主的评价原则。《数学课程标准》“评价建议”要求“发挥评价的激励作用,保护学生的自尊心和自信心。”在解答一题多解类题目或开放类题目时,对学生说出、写出的不同解法,教师要加以激励,如写出激励性评语:“你真棒!”“你真了不起!”……在阅卷时,应适当给第一种解法以外的每种解法加分。以此来培养学生的创新精神,培养学生的创新能力,增强学生的自信心。

3、过程性原则一种重过程轻结果的评价原则。《数学课程标准》要求“注重对学生学习过程的评价。”“课改前的评价过分关注评价的结果,而忽略了对过程的评价。”特别对解题的评价要忽略关注结果,更要重视解题的过程。

如学生在进行简便计算时,简算过程是对的,但结果却计算错了;再如,在解答某道应用题时,学生的分析思路是对的,但由于未看清数字,在解题列式时算式是错的。这时,我们就不能光看算式本身和结果的正确性,而要看到学生思维的正确性。只不过要在旁加注“提示语”,如“如果你细心些!相信你一定能解答正确。”在评价时,要给大部分的分数。

4、发展性原则新课改倡导的“立足过程,促进发展”的评价原则。对学生的评价应当从甄别式评价转向发展性评价。在评价学生的解题时,既要评价学生对数学知识与技能的理解和掌握,更要评价他们技能的形成和发展。应当增强评价的诊断功能和促进功能,更注重学生解题的发展过程,重点放在纵向评价,强调学生解题的过去与现在的比较,着重于学生素质的增值,不是简单的分类级排次序,使学生真正体验到自己进步。

五、解题评价的策略

笔者结合教学实际,谈谈执行《数学课程标准》情况下解题的评价策略——阶段性评价策略、对象性评价策略、相对性评价策略、多元性评价策略、激励性评价策略。

1、阶段性评价策略由于数学知识呈现阶段性,导致解题思路的阶段性,这就是“双基”所起的前提作用。如“一个正方形周长是6分米。求它的面积。”三年级学生还没有学过小数和分数,因而能把6分米化成60厘米做出(604)(604)=225(平方厘米)的解答,理当首肯。但到了高年级,这种解法未必唯一。

2、对象性评价策略某种解题思路的优劣,主要取决于解题对象的认知水平、解题经验、策略及非认知因素的协同作用。某种解法对于教师来讲确实妙不可言,但学生一点也不能理解,又怎么能说是最佳呢?对于甲生来说属于一般的思考方法,对于乙生可能就觉得十分独特。因此,解题思路的优劣随解题对象而变异。这就要求教师了解每个学生的思维特点及头脑中认知结构的组织成分,对其解题思路做出“因人而异”的判断,切忌以优秀生的思路水平为标准去要求、衡量一般生及后进生的思路。

3、相对性评价策略某种解题思路的优劣往往是相对的,有的思路独特但计算繁琐;有的计算简便但思路普通;……教师评价时要

从多种不同角度、层次进行分析比较,促其提高。

如,《东方生活报·小学校园文化》2004年第9期的《不同的比较方法》:“两个学生在比赛跳绳。一名男生3分钟跳了297个,一名女生2分钟跳了194个。谁跳得快?”(苏教版小学教科书《数学》第五册第55页第8题)

解法一:先算出两人每分钟各跳了多少个,然后比较:谁跳得个数多,谁就跳得快。

男生每分钟跳297÷3=99(个),女生每分钟跳194÷2=97(个),99>97,因此男生跳得快。

解法二:男生每分钟跳297÷3=99(个),如果他只跳2分钟,共跳99×2=198(个)。男生2分钟跳的198个比女生2分钟跳的194个多,因此男生跳得快。

解法三:女生每分钟跳194÷2=97(个),她如果也跳3分钟,共跳97×3=291(个)。男生3分钟跳的297个比女生3分钟跳的291个多,因此男生跳得快。

解法四:男生每分钟跳297÷3=99(个),如果女生第1分钟与男生跳同样多,她第2分钟只跳了194-99=95(个)。男生第2分钟跳的99个比女生第2分钟跳的95个多,因此男生跳得快。

解法五:女生每分钟跳194÷2=97(个),如果男生第3分钟与女生每分钟跳得同样多,他前2分钟共跳了297-97=200(个),200>194,因此男生跳得快。

解法六:如果算出两个人在同一时间内各自跳的个数,再比较大小,谁跳的个数多谁就跳的快。因为2与3是相邻的两个自然数,所以可以先算出两人分别在6分钟内各自跳的个数,再比较大小。(想想:还可以算出哪些时间内各自跳的个数?)

男生6分钟共跳了297×2=594(个),女生6分钟共跳了194×3=582(个)。(想一想:为什么可以这样列式?)594>582,因此男生跳得快。

当然,可以先算出跳同样多的个数各自用去的时间,然后比较:谁用的时间少反而跳得快。不过,这道题比较复杂、繁琐。

解法一思路清晰,计算简便,后进生能做出解法一,要从根本上加以肯定;解法二、三、四、五适宜中等生;解法六思路新异但较难理解,适宜优等生。

4、多元性评价策略现在有种误解,以为最佳思路仅有一种,否定最佳思路的多元性。其实,在众多解法中,有时往往有几种思路平分秋色,难以说清谁鹤立鸡群,只能模糊地都定为“好解法”而加以肯定。

如,2004年12月17日《小学生数学报》B2版的《装配自行车》:“一个自行车厂要装配32辆自行车,有60个车轮够不够?”(苏教版小学教科书《数学》第五册P7)

解法1:因为每辆自行车要装配2个车轮,所以32辆自行车需要32×2=64个车轮。已有的60个车轮比需要的64个车轮少,因此不够装。

解法2:因为每辆自行车要装配2个车轮,即前后轮各装1个,32辆自行车各装32个前轮、32个后轮,32辆自行车共需要装32+32=64个车轮。60<64,因此不够装。

解法3:因为每辆自行车要装配2个车轮,所以60个车轮只能装60÷2=30辆自行车。30<32,因此不够装。

解法4:要装配的32辆自行车,如果每辆自行车先装1个前轮或后轮,共装了32个车轮,准备的60个车轮还剩60-32=28个。剩下的28个车轮再给32辆自行车各装1个后轮或前轮,少4个。因此,要装配32辆自行车,只有60个车轮不够。

上面介绍的加、减、乘、除四种方法,你能说清哪种思路最佳吗?

5、激励性评价策略有些解思路的确不同凡响,赢得师生一致公认为“最佳思路”,教师就应毫不含糊地加以肯定和表扬,通过记优分、用学生姓名命名“鬃解法”等鼓励先进,激励全体学生善于开动脑筋,大胆别出心裁,这样更能有效地训练学生思维,提高思维品质。

如解答装苹果的应用题:“小猴买来一批苹果,每筐装5千克,可以装6筐。现在只有5只筐,把苹果都装上,平均每筐多装多少千克?”(《数学奥林匹克天天练·小学二年级》,南京大学出版社)

王强:先根据“每筐装5千克”和“可以装6筐”这两个条件,可以求出这批苹果的总重量是5×6=30(千克),再根据“总重量30千克”和“装在5只筐”可以求出现在平均每筐装30÷5=6(千克),最后算出平均每筐多装6-5=1(千克)。综合算式:5×6÷5-5=1(千克)

数学评价论文篇2

关键词:小学数学作业评价改革与尝试

小学数学作业评价是实施数学学习评价的重要组成部分,是课堂教学的延续,也是师生交流互动的一种方式。评价是向学生反馈学习情况的一种形式,其目的是为了促进学生全面发展。不少老师认为,作业评价就是批改作业,没有把作业批改上升到作业评价的高度。有的老师甚至连给学生评定一个等级和分数的功夫也省去了,只是简单的打一个“√”或者“×”,或者写一个“阅”字了事。有的老师在作业评价时,对好学生的作业往往批改得十分仔细,而对一些所谓的后进生的作业,往往是不屑一顾。后进生在作业批改中的待遇是十分低下的,他们的作业中做错的地方,老师打下的“×”一般都是大号的,特别是在做错了作业而书写又不认真的时候,老师会在作业后面重重地写下一道命令:重做!有的在作业规范的要求上时松时紧,在作业规范的标准上时高时低,不能以一贯之,虽然花了不少力气,但学生的作业总是做不好。针对当前小学数学作业评价的现状,结合本人的教学实际,谈谈自己的几点做法。

一、让作业评价成为学生发展的动力

人的内心深处都有一种被肯定,被尊重,被赏识的需要,每个人仿佛都是为了受赏识而生存为此,教师应尊重学生,赏识学生。用赏识的眼光和心态去批阅学生的每次作业,从中寻找点滴的闪光点,用赏识的语言进行激励。使他们的心灵在教师的赏识中得到舒展,让他们变得越来越优秀,越来越有自信。特别是对于急需鼓励的中后学生。心理学研究表明,学生获得表扬,奖励次数越多,其行为活动的再发性就越高。及时有度的呈现激励性评价,能有效引起师生情感共鸣。

例如:我班的刘宇同学是班里公认的待提高生。该生没有良好的学习习惯,作业常做的零乱、潦草,而且时常出错,有时还不做作业。有一天,由于作业较简单,刘朝宇积极完成了作业,并且全部正确,只是作业的书写还是比较的糟糕,但当时我没有批评他书写不工整,而是给了他肯定的评价,等级也给的是A级,他很开心,看到他当时的表情,我又对他语重心长地说:你今天的作业做的不错,全部都正确了,说明你今天上课时认真学习了,要是你再把你的字写的工整一点,你的作业就更好啦。同时还当着全班同学的面表扬了他,给了他很大鼓励。有了这次的经历,张宇上课的学习态度端正多了,坏习惯也改掉了不少,作业也不再像以前那样零乱、潦草,笔误也少了很多。可见老师的鼓励对学生来说是多么的重要,既能鼓励学生上进,还能充分的调动学生的学习积极性。

二、通过作业评价,充分保护学生的自信心和学习积极性

一个人的智力水平是不平衡的,对于学生来讲他们的知识基础和学习态度也是不平衡的,即使是优等生也可能有失误的时候。当学生的作业错误过多,过严重时,为了避免学生作业等级太低,给学生照成心理压力太大,以及产生知识上的脱节和恶性循环,我们在评价学生作业时可以采取暂不评价,不评判作业等级的策略。给学生留点空间和时间,让学生弄清了错误的原因,补充了所缺的知识,将作业重做了之后再进行评判。

例如:教学列式计算时,有一道这样的题目:78加上1000除25的商,和是多少?有的学生这样列式:78+1000÷25,这时我并没有对学生的作业进行等级评价,也没有指责他们,而是指导他们去复习课本上的同类例题,学生弄清了道理,把错题纠正以后,再进行评价。这样既没有给学生造成心理上太大的压力,也保护了学生的自信心和学习积极性,同时也让学生弄明白了除和除以的区别。

三.通过眉批的鼓励性语言,提高作业质量

学生对知识的掌握是一个循序渐进的过程。在作业过程中许多学生难以一次达到较高的水平,得到自己满意的等级。针对学生的这一现象,我采取了一题多改逐次提高等级的评价策略来调动学生进一步改进作业质量的积极。当作业批改后发给学生,如果学生能够及时的纠正错误,弥补不足,或者补充更好的解题方法,就视情况给学生作业提高等级。为了增强实效,我还经常在批改作业时加一些针对性、启发性、鼓励性的眉批。

对于一向爱动脑的学生评语是:“你与众不同的见解,真让人耳目一新”;“你真棒!老师还没想到的这种做法,我向你学习”;“你的头脑真灵活,这种方法比老师的方法强多了”。

而对于聪明的小马虎的评语是:“方法很好,仔细查一查,看问题出在哪里?希望你告别粗心,与细心交朋友”“如果再仔细一点,相信成功一定属于你”。

对作业认真,字迹工整,但内容有错的评语是:“多漂亮的字呀!要是再仔细一点就好了!”

而对书写潦草,尚欠认真的学生,给的评议是:“做得很好!如能把字写的再漂亮点,就更好了。”

针对各种不同的情况,还可以用不同的赞扬和鼓励性的评价语言。如:“大有进步,再加油!”“你真棒,有这么大的进步,老师真为你感到高兴!”“继续努力,相信你会更好!”

有人说:“教师的语言如钥匙,能打开学生心灵的窗户;如火炬,能照亮学生的未来;如种子,能深埋在学生的心里。”走进学生的心灵,关注学生的发展,从内心深处赞赏,欣赏每一位学生,与之建成和谐的师生关系,使每个学生把作业当作与教师交流的机会。获得一种自我的满足与成功感,使学生获得知识的同时,体验着理解、信任、友爱、尊重和鼓励。

四、师生互动,当面评价

在评价学生的作业时,会出现一些令教师疑惑不解的情况。如:当对某一道题的解题过程很特别,很简略,而结果却是正确的,这是一种结果的偶然巧合还是一种新颖的别致的解法呢?为了实事求是地批改作业,不伤害学生的自尊心和学习积极性,培养学生的创造思维能力,禁止抄袭作业的现象发生,我采取了当面评价的策略。将学生叫到旁边把对这种解法的疑惑指出来,让学生来帮助解惑。

数学评价论文篇3

关键词:数学大纲;数学课本评价;数学教与学:数学教育评价

1前言

世纪90年代,中国的数学教育改革已经经历了15年.数学教育的改革为数学教材的繁荣起到了积极的推动作用.从2001年开始,经教育部中小学教材审定委员会审查通过,有多种小学、初中、高中数学标准实验教材向全国发行.但新教材的使用情况,尤其是使用新教材学生的数学成就如何尚没有系统的测试和研究.为了总结教材的使用情况,巩固其长处,改进不足之处,帮助广大教师和教研员更好地贯彻和施行大纲所规定的数学教学内容,我们对使用不同教材的小学和初中学生的学习成就进行了测试和评价.小学部分,选择了使用小学新教材(以下简称小学新教材)的学生与使用其它教材(以下简称小学其它教材)的学生以及部分可比性较强的国家(地区)的学生进行比较.初中部分,选择了使用初中新教材(以下简称初中新教材)的学生与使用其它教材(以下简称初中其它教材)的学生以及部分可比性较强的国家(地区)的学生进行比较.其目的旨在回顾和了解学生使用不同教材的数学成就和教材的使用情况.在这个报告里,就小学新教材与小学其它教材,初中新教材与初中其它教材以及部分国外(地区)学生的学习成就和他们的学习态度以比较的形式对测试做一个总结,其目的是总结教材的使用情况,巩固教材的长处,改进不足之处,帮助广大使用北师大版教材的教师和教研员更好地贯彻和施行大纲所规定的数学教学内容.

2测试什么为了有利于比较使用新教材的学生的学习成就与其他国家相同年级学生的学习成就,本报告的数学题选择使用(1)小学部分:学生试题采用‘国际数学和科学研究趋势》

(IEA,2003a)所使用的数学题;学生调查问卷采用经过修改的‘国际数学和科学研究趋势》的四年级学生问卷(1EA,2003b).(2)初中部分:学生试题采用‘国际数学和科学研究趋势》(1EA,2003c),经济合作发展组织‘国际学生评价项目》(PISA,2003),和自己设计的题目;学生调查问卷采用经过修改的《国际数学和科学研究趋势》(ⅢA,2003)的八年级学生问卷.选择《国际数学和科学研究趋势》和《国际学生评价项目》,是因为他们是国际上公认的中小学生数学和科学的学习成就评价项目.《国际数学和科学研究趋势》的目的是检查四年级和八年级学生在教学大纲的范围内会什么和能做什么(Mullis,Martin,Gonzalez,&Chrostowski,2003),它的题目比较接近中小学大纲的要求;而《国际学生评价项目》的目的是检查学生在15岁时的数学应用能力.需要指出的是,《国际数学和科学研究趋势》和《国际学生评价项目》的题目不是数学竞赛题,因此其难度应该属于大纲要求的应知应会的范畴,其测试的目的之一,是想要知道对一个国家整体而言,公共教育的水准究竟有多高,学生对数学和科学的学习态度如何,以及影响学生成就的因素.毫无疑问,这对一个国家的整体发展和未来的劳动力资源是十分重要的.因此,找出影响学生成就的因素对发展大众教育和改善国家整体教育水平是十分必要的.在这个报告里,我们的目的是测试使用新教材的学生与使用其它教材的学生和国外(地区)学生在数学知识,数学认知水平上的不同,以及相关的影响因素.我们选择部分可比性较强的国家(地区)进行比较,他们是:(1)小学部分:香港、日本、俄罗斯、新加坡、美国;(2)初中部分:中国台北,中国香港,日本,韩国,新加坡,美国,澳大利亚,芬兰,法国.需要指出的是:(1)这些国家的数据代表的是整体国家水平或接近国家水平CR范围随机抽样),而数据只代表抽样的范围;(2)在初中部分,‘国际数学和科学研究趋势》和‘国际学生评价项目》测试的是八年级和15岁的年龄段,而我们选择的是九年级的学生,原因是八年级的教学大纲有部分内容未涵盖测试内容;(3)自己设计的题目主要涵盖初中概率和几何的内容.在这个测试里,我们想要回答的问题是:

(I)新教材的学生与其它教材的学生以及国外(地区)学生的数学成就和数学认知水平有什么不同?(2)新教材的学生与其它教材的学生对数学学习的态度有什么不同?3)不同城市、不同教材的学生的数学成就和数学态度有什么不同?

3测试方法

3.1数据的收集考虑收集数据的随机性,并且易于比较,本测试的数据收集选择既有大中城市,又有县城,既有沿海,又有内陆,且好学校与差学校有基本相等比重的方法

3.2测试题目及问卷设计和数据分析本测试小学部分采纳选择后的<国际数学和科学研究趋势》的数学测试题目和问卷,初中部分采纳3个方面的题目:

(1)‘国际数学和科学研究趋势》的数学测试题目(题1—16)i(2)‘国际学生评价项目》的数学测试题目(题17);(3)自己设计的题目(题18—20).选择‘国际数学和科学研究趋势》和‘国际学生评价项目》的数学测试题目的原因是有利于与其他国家作比较;而自己设计的题目则重点测试学生在概率和几何方面的成就.测试的内容包含两个方面:

127126l1164234273356一个是数学内容,另一个是数学认知水平.小学数学内容包含数和运算、代数的规律和关系、测量、几何和数据;初中的数学内容包含数和运算、代数、几何、测量、概率统计;数学认知水平包含懂得数学解题过程,懂得数学概念,能解决日常问题和数学推理.本测试选择的小学数学有20题共26个问题,在数学内容和数学认知水平上的百分比分别是:

(1)数学内容:数和运算42%,代数的规律和关系15%,测量12%,几何19%,数据12%;(2)数学认知水平:懂得数学解题步骤7%,懂得数学概念29%,能解决日常问题57%,数学推理7%.本测试选择的初中数学有20题共29个问题,在数学内容和数学认知水平的百分比分别是:

(I)数学内容:数和运算14%,代数18%,几何25%,测量14%,统计和概率29%;(2)数学认知水平:懂得数学步骤11%,懂得数学概念18%,能解决日常问题32%,数学推理39%.表3列出了本测试小学和初中在数学内容和数学认知水平以及主要数学问题的情况.小学学生和初中学生调查问卷主要涉及学生对数学学习的态度.较.为保证数据的精确性,数据的编纂采用相互校对的方法,有问题的数据经过讨论达到一致.

3.3可信度由统计软件得数学测试题的信度,小学为72.3%,初中为71.8%;学生调查问卷的信度小学为80.1%,初中为72.5%.这表明数学测试题和学生的问卷是可信的(信度一般要高于70%).4.2学生认知水平(1)小学.表8展示了使用小学新教材的学生与国外(地区)学生和使用小学其它教材的学生在数学认知水平(懂得数学解题过程,懂得数学概念,能解决日常问题,和数学推理)上的比较.4.4不同课本在不同城市学生的数学成绩和学习态度差异(1)小学.①数学成绩.表12展示了不同城市使用小学新教材的学生与小学其它教材的学生在平均数学成就上的比较.不同城市的学生在数学学习态度上相差较大.不同城市的学生在“我的数学学得很好”的百分比从42.0%到84.6%不等(相差42.6%);不同城市的学生在“数学是我的强项”的百分比从39.7%到64.8%不等(相差25.1%);不同城市的学生在“我数学进步很快”的百分比从48.1%到82.O%不等(相差33.9%);不同城市的学生在“学好数学才能考上理想的大学”的百分比从44.0%到75.4%不等(相差31.4%);虽然不同城市的学生在“我想获得一份与数学直接相关的工作”的百分比的差异不大,但都很低,从36.6%至1J49.6%不等(相差13.4%);不同城市的学生在“学好数学才能获得自己想要的工作”的百分比的差异较大,而且较低,从29.7%到50.8%不等(相差21.1%).

数学评价论文篇4

【关键词】毕业论文;评价指标体系;灰色层次分析法

邓聚龙教授1982年提出的灰色系统理论,其核心思想是可将信息根据明确与否分成三个系统:完全明确的白色系统、信息未知的黑色系统和介于其间部分信息明确但部分信息不明确的灰色系统。由于该理论模型对实验观测数据要求不高,因此应用领域十分广泛。大学毕业论文评价是一个典型的多因素综合评价问题,其评价时需要的信息部分为潜信息,同时所采用的评价指标不能完全涵盖所有情况。加之评价指标间的复杂关系,造成该评价过程具有很大的灰性。大学本科毕业论文呢的评价过程中,通常需要评价者的主观判断来确定等级,比如对毕业论文评价常用的学术严谨性、创新性等指标的评价,采用传统评价方法难以客观公正的评价。实践证明,灰色系统理论能有效克服模糊评价中信息丢失和主观性强等问题。通过构建科学有效的评价指标,并依据评价指标设计模型,并运用灰色层次分析法(GAHP)对区间灰数的白化处理,可使本科毕业论文的综合评价更客观公正。

一、灰色层次分析法

一般而言,灰色层次分析法在应用到综合评价中过程大致包括以下步骤:

步骤一,指标体系建立及权重确定。本科毕业论文的评价指标由目标层(W)、准则层(Ui)、一级指标层(Vij)和二级指标层(Vijm)构成。根据建立的目标层次结构,各指标权重则运用层次分析法,根据评价专家对同一层次的各元素对上层某一准则的重要性进行两两比较,构造互反判断矩阵,采用最大特征根法计算相邻层次中下层对上层元素的组合权重。

步骤二,确定评价灰类。确定评价灰类包括一般确定评价灰类等级数、灰数及白化权函数三方面内容。一般采用四个评价灰类:第一灰类“优”(G=4),灰数为1∈[4,+∞],其白化权函数为f1(dijm);第二灰类“良好”(G=3),灰数为2∈[0,3,6],其白化权函数为f2(dijm);第三灰类“及格”(G=2),灰数为2∈[0,2,4],其白化权函数为f3(dijm);第四灰类“不及格”(G=1),灰数为1∈[0,1,2],其白化权函数为f4(dijm)。

步骤三,组织评价专家打分。根据本科论文评价需要,邀请p个专家,且对每个评价专家进行排序,序号为m=1,2,…p。组织专家对评价指标进行实测值和目标值间的比较,然后依据专家经验对各指标打分,并填写评分表。为简便起见,一般规定评分范围为1-5分,待评价指标Vij给出评分dijm由第m个专家评出。

步骤四,计算评价系数、评价权向量及矩阵。对评价指标Vij,先确定指标Vij属于第G个灰类,然后根据灰类的白化隶属函数计算出灰色评价系数,XijG=∑fG(dijm),m∈[1,p],同理可构建评价样本矩阵;在灰色评价系数已知基础上,加总同一评价灰类的评价值,可得各评价灰类的总灰类评价数,记为Xij=∑XijG;至于灰色评价权向量,则是通过对灰类评价系数的归一化处理,可得各类评价灰类的灰类评价权矩阵Wij。

步骤五,综合评价。首先进行指标层的综合评价,其评价结果记Bij;其次根据指标层的评价结果构建准则层对各评价灰类的灰色评价权矩阵Bi,进而进行准则层的综合评价,其评价结果记Bi;同理根据评价结果Bi,按照最大原则确定受评对象归属的等级数,根据E=U×CT可求出综合评价值,其中C表示各灰类等级按“灰水平”赋值形成的向量,可设置为G=[4,3,2,1]。

二、应用实例

本研究以广西财经学院本科毕业论文评价为案例,采用灰色层次分析评价进行验证,具体应用过程如下。

1.建立毕业论文质量评审的指标体系

广西财经学院的本科毕业论文灰色评价指标体系构建如表1所示。根据灰色层次分析法建模需要将指标体系设计成指标系统、权重系统和评价标准系统三大系统组成。

2.专家评分

根据项目需要,选取专家5名,通过调研数据与数据配比对各指标进行评分,赋分范围为1-5,指标等级介于相邻两等级之间时,相应评分值为4.5,3.5,2.5和1.5,根据调研结果和获取的相关数据,评分结果略。

3.计算灰色评价系数、灰色评价权向量及权矩阵

对于指标(V111),被评指标属于第G个评价灰类的灰色评价系数V111G,当G=1,有

V1111=f(1.5)+f(2.0)+f(2.5)+f(2.0)+f(2.0)=2.5;同理可得V1112,V1113和V1114及其他指标的灰色评价系数及灰色权向量。

4、逐级对指标层进行综合评价

第一步,对二级指标进行综合评价;

B11=[0.4514,0.3523,0.1518,2902];

B12=[0.4013,0.3950,01913,0.3875];

B13=[0.5563,0.3863,0.0575,0.2500];

B21=[0.2900,0.3763,0.2050,0.7050];

B22=[0.3600,0.3900,0.2600,0.0000]

第二部,对一级指标进行综合评价

B1=[0.4574,0.3719,0.1448,0.8826];

B2=[0.3180,0.3818,0.2270,0.8230]

第三步,对准则层进行综合评价;U=[0.4086,0.3754,0.1736,0.8617]

第四步,可得综合评价结果:E=U×CT=3.97。

5.评价结果

根据评价最终得分,评价小组对被评审论文初步结论进行深入分析判断,总体看该论文结果评为“良好”,非常接近优秀水平。

三、结束语

本文采用灰色层次分析法评价广西财经学院本科毕业论文的质量,系统地提出了三个一级指标和十二个二级指标,该方法的应用有效地实现了定量分析和定性分析的统一。由于该方法能充分考虑了指标之间的内在关系和评价系统的灰性,所得量化值在一定程度上客观反映论文水平的实际情况,因此,该方法具有一定的科学性。但是毕业论文质量评价模型的建立,并不是一成不变的,需要我们随着不断发展变化的新形势,不断检验和完善毕业论文评价体系,以使论文的评价更客观公正。

参考文献:

[1] 邓聚龙.灰色系统基本方法[M].武汉:华中科技大学出版社,2005年

[2] 黄勇,查道林.基于灰色层次分析法的大学院长经济责任审计评价研究[J].财会通讯,2010年6期上

[3] 演克武,朱金福,刘锋.基于灰色层次分析法的航空公司机型适应性综合评价研究[J].数学的实践与认识,2009年7月

数学评价论文篇5

随着信息化、数字化、网络化的快速发展和知识社会的来临,国家对科学研究投入大幅增加,如何公正、合理进行学术评价已成为国内外学术界普遍关注的问题。因为它不仅涉及研究人员的切身利益,更与国家巨额投入能否合理分配和学术研究能否健康发展、研究质量能否提高有着密切的关系。近20年来,国内外学界对引文数据、同行评价等的作用有过激烈争论。实际上,引文等文献计量数据与同行评价并不是定性与定量等“二元”对立的关系,引文数据等既包含学术共同体的评价又具有量化的因素(即“二含论”)。笔者近期提出的形式评价、内容评价和效用评价的“三位一体”新概念组合,试图以此合理解释学术评价的历史、现状及预测未来(参见:叶继元,人文社会科学评价体系探讨,南京大学学报,哲学、人文科学、社会科学版,2010(1):97-10)。引文数据等属于形式评价,它不能代替内容评价和效用评价,但却是内容评价和效用评价的基础。根据评价目的,有时仅形式评价即可,有时则必须内容评价或效用评价。应该精细评价的绝不能进行简单、粗糙的评价,而应该简单评价的也不能人为复杂化。如何结合新的理论和观念、新的信息技术将以引文为主的文献计量的形式评价和内容、效用评价的研究不断深化和完善,显然还有许多工作要做。

众所周知,学术期刊以其连续、定期、快速等传播特点,在学术成果的评价、认定、发表、交流、争鸣等方面具有不可取代的重要作用。同时学术期刊是联结学者与评价的纽带,期刊本身又是评价的客体,一直是学术评价的重要组成部分。因此近期有关期刊的评价也正在各个层面热烈展开。有鉴于此,本期专栏刊发的5篇文章(均系国家社会科学基金重大项目“建立与完善哲学社会科学评价体系研究”(项目编号:04ZD031)研究成果),主要针对学术评价,尤其是人文社会科学研究所具有的多样性、本土性以及与自然科学相比更为“软化性”等特点,针对期刊评价的多元性、开放性等特点,深入探讨评价和期刊问题。论文《期刊分层:期刊评价研究的历史社会学解析》首先回溯了我国期刊评价研究的发展历程,并试图引入全新的理论视角来阐释期刊之间的等级现象。开放存取作为一种全新的出版模式,对传统的以期刊为主的学术交流体系产生了巨大的冲击。论文《开放存取期刊评价模型构建》提出了开放存取期刊的评价指标体系,并构建了开放存取期刊的评价模型,对开放存取期刊评价的理论构建和实践实施都有一定参考价值。在学术评价研究中,评价工具的研究与发展最为迅速,争论也最为激烈。论文《社会网络分析在引文评价中的应用研究》和《中文引文索引主题图的构建及其实现》分别将社会网络分析和主题图技术引入到引文评价中。前者用以改进引文评价方法,补充引文评价指标;后者用以强化引文索引数据库的检索、信息精选和学术评价功能。无论是期刊评价研究还是评价工具的研究,本身都必须回归到服务于学术评价、促进学术发展上来。论文《人文社会科学评价的复杂性与引文评价指标的修正》从学理层次论证了人文社会科学的评价的必要性、可能性和复杂性,并在深入分析引文的模糊性和时空特殊性的基础上,对现行的学术评价方法和评价体系进行补充和完善。热望读者评论、指正。

数学评价论文篇6

关键词 科研竞争力评估文献计量 院系

1 机构内科研竞争力分析的意义

随着我国科研的发展,科研资源的配置越来越受到关注,各种科研竞争力评估也应运而生。众多评估案例从不同角度、采取不同的指标来评价机构间的科研实力,也产生了很多版本的高校排名。目前常见评估案例的内容以机构间的对比评价为主,主要为部级别的资源配置提供信息。但对于单个的科研机构而言,其管理部门还经常需要在机构内部的各子机构之间配置资源,因而迫切需要全面了解院系等子机构的科研发展情况,识别出较有潜力的领域和科研团队。在这种情况下,针对某一机构及其子机构的科研竞争力分析报告,将有助于管理部门准确把握各机构目前在国内外所处的位置,科学判断机构所面临的竞争态势,合理分配科研资源。

2011年北京大学发展规划部为编写“十二五”规划,委托北京大学图书馆对本校的科研实力进行评估。为此,图书馆信息咨询部逐步探索了兼顾机构内外,全面反映机构本身及其子机构的科研现状及发展趋势的评估方法,对北京大学学术论文方面的科研竞争力进行了量化评估,最终完成《北京大学科研实力分析报告》。报告通过客观的数据分析,帮助北京大学的科研管理人员更为准确地了解目前的竞争优势与劣势,并为科研决策提供可靠的信息支撑。

2 机构内科研竞争力的评价思路

2.1 评价角度

科研的评价角度非常多,如:学术论文产出情况、著作产出情况、获奖情况、科研项目情况、科技会议参与情况、经费的获取与投入产出比情况等。无论从何种角度出发,都要在同行评议的同时,提供一个基于客观数据的量化评估体系作为基准和参考,才能实现公平客观、科学合理的科研评估。文献计量学分析将提供有关学术活动的一般特征信息,还是一个保持同行评议过程诚信的工具。因此,本文从文献计量的角度,探讨如何依据事实数据,客观评估机构、尤其是其子机构(院系)在学术论文方面的科研竞争实力。

本次评估从机构科研决策的需要出发,主旨在于帮助管理者发现机构的优势、劣势和突破口,因此既需要评估机构的整体科研实力和影响力,也会涉及各院系及个人的科研情况。此外,由于国内外不同机构的院系设置差异较大,难以实现真正院系级别的比较,只能通过学科评估作为院系评估的参考。因此,本文的科研竞争力评估主要包含三个层次:其一,北大整体科研实力以及与国内外知名高校的横向比较;其二,北大各学科的发展情况及其在国内外的地位;其三,北大各院系及研究人员的科研实力。

2.2 评价标准

在机构整体科研竞争力方面,主要分析机构论文被web of Science(WOS)等著名数据库收录和引用的情况,并将其与国内外知名高校进行对比,客观衡量当前的科研实力水平;考察特定时间段内机构论文的收录及被引数量变化,分析机构科研竞争力的发展趋势。考虑到科研人员在领域内著名期刊或影响因子较高的期刊上发表成果通常被视为科研绩效的一种指标,本次评估增加了机构通讯作者、JCR核心期刊、《Nature》、《Science》等的发文量统计;另外,鉴于人文社科领域国内发表的作品较多,将CNKI、CSSCI等中文数据库的收录引用情况作为参考。

在学科科研竞争力方面,主要分析不同学科的活跃程度;分析在全球有一定影响力的学科的及被引情况,并与国内外相关机构进行比较;此外,鉴于人文社科领域的特殊性,将此领域内各学科的论文收录情况与国内人文社科重点院校进行比较。

在院系的科研竞争力方面,主要考察各院系论文的收录及被引情况,并分析特定时间段内院系论文被收录及被引用的数量发展趋势;进行JCR核心期刊、《Nature》、《Science》、ESI的论文统计,识别出院系科研影响力较高的论文及其作者;此外,对多院系合作的论文进行单独分析,考察多院系合作论文的影响力和优秀率,以及学科交融情况。

2.3 数据来源

本文的评估数据主要以WOS数据库的SCI、SSCI、A&HCI数据为主,并参考基本科学指标数据库(Essential Science Indicators,ESI)、期刊引证报告(Journal Citation Reports,JCR)、《Nature》、《Sci-ence》的部分数据。人文社科领域以中国社会科学引文数据库(CSSCI),中国期刊网(CNKI)作为补充。

数据由北京大学图书馆信息咨询部成员按照作者署名、地址等从上述数据库中提取。由于短期的数据难以全面反映机构的科研实力和变化情况,因此本次评估提取了北京大学从2000年到2010年的科研产出数据,包括SCI中的2.5万余篇,CSSCI中的1.9万余篇,CNKI中的2.3万余篇,ESI中的近300篇文章。

由于数据库中作者、地址等字段的数据信息经常会出现不够规范和准确的情况,因此本次评估对提取出的数据库信息进行了人工清理,保证数据具有一定的准确性后再进行下一步的科研竞争力分析。

3 机构科研竞争力评价方法

3.1 整体科研竞争力评价方法

北京大学的整体科研竞争力主要从WOS总收录论文数、总被引次数、篇均被引次数进行分析,评价了2000~2010年北京大学被SCI、SSCI、A 8LHCI数据库收录的论文数量、总被引用次数、平均每篇论文被引次数。为降低国外合作对评估机构真实科研竞争力的影响,进一步分析了北京大学科研人员作为通讯作者的论文占总论文数的比重。同时,将北京大学被SCI、SSCI、A&LHCI数据库收录的论文数量和篇均被引次数与哈佛大学、牛津大学、香港大学、清华大学等国内外知名高校进行对比,衡量北京大学整体科研竞争力在国内外的地位。

考虑到不同学科在期刊论文的发表和引用方面有着很大的差异,我们采取分学科的方式选取优秀期刊,具体做法为:以JCR的特征因子指标为主要参考依据,按照2010年JCR自然科学版和JCR人文社科版的学科分类,选取各学科下特征因子排序前10名的期刊作为优秀期刊。自然科学版分为173个学科,选出1376种优秀期刊;JCR人文社科版分为55个学科,选出462种优秀期刊;两部分去重后共有1759种期刊。最后统计出北京大学在2000-2010年被SCI、SSCI、A~HCI收录的全部论文中发表在JCR优秀期刊上的比例。此外,还统计了北京大学在2000—2010年间每年在《Nature》和《Science》上的数量。

此外,在人文社科领域,我们统计了北大发表的中文论文被CSSCI、中国期刊网人文社科领域核心期刊的收录情况,并与人民大学、复旦大学等国内人文社科重点院校进行对比。

3.2 各学科科研竞争力评价方法

北京大学各学科科研竞争力评价包括根据WOS的SCI、SSCI、A&HCI数据,分析2000-2010年机构发文量最活跃的排名前10位的学科,分别统计理工科和人文社科发文量排名前10的学科。鉴于不同学科之间论文的情况存在显著差异,机构、学科、院系、个人等各个层次的评估都尽量避免不同学科间的比较,主要与国内外同学科的机构、子机构或国际平均水平进行对比。

根据ESI数据分析北大进入全球1%的学科中,WOS收录的论文篇数和篇均被引次数,从每个学科选取ESI中排名前5位的各国高校进行比较,同时选取清华大学、中国科技大学等若干综合实力较强的国内高校与北大进行对比。

鉴于人文社会科学的特殊性,“Social Sciences,General”学科选取人文社科重点院校中国人民大学、复旦大学等进行对比,并将上述人文社科重点院校被CSSCI收录的各学科论文数量与北大进行对比。

3.3 院系的科研竞争力评价方法

北京大学内各院系由于学科的不同,总收录论文数量、总被引次数以及篇均被引次数存在较大差异。评估将2000~2010年各院系发表的论文被SCI、SSCI、A&HCI收录及被引用次数分别按照理工类、交叉学科类、人文社科类进行归类,并分析变化趋势。由于论文数量较少的院系的被引用次数受单篇论文影响较显著,因此只挑选收录和被引较高的前10个院系进行分析。

分析北京大学各院系2001-2010年SCI、SS-CI、A&HCI收录的论文中,在JCR优秀期刊上按发文量排名前20的院系,并计算这些院系在JCR优秀期刊上的发文比例。根据ESI的数据,统计2000—2011年各院系在本领域进入全球前1%行列的论文数量及通讯作者为机构人员的论文数量。此外,将2000-2011年各院系在《Science》和《Nature》上发表的论文数量作为补充指标。

3.4 识别突出科研人员和科研合作情况

分析北京大学各院系2000-2010年在《Sci-ence》和《Nature》上的作者,并根据ESI的数据,统计出各院系进入全球前1%高引论文的作者,尤其是ESI中被引次数高、且通讯作者为北京大学科研人员的优秀论文。通过高被引文章和权威期刊文章识别各院系中成果突出的科研人员。

为了解院系间的合作对科研产出数量与质量的影响以及学科间交融的情况,本次评估同时也分析了北京大学2001-2010年被SCI、SSCI、A&HCI收录的论文中,由不同院系合作完成的论文数量和变化趋势,以及论文的质量和影响力情况,并分析了合作在JCR优秀期刊的比例是否高于全校整体的优秀论文比例。

4 评价小结

此次科研竞争力的评估主要基于SCI、SSCI、A&HCI、中国知网、中国社会科学引文索引等国内外知名数据库中的文献统计信息,并参考JCR、ESI等专业学科评估工具,力图客观、如实地反映北京大学在学术论文方面的科研竞争实力。此外,尝试了院系层面的科研实力、科研合作等方面的分析评估,填补了以往科研实力评估中高校与个人两个层面之间院系层次评估的空白,也为学校的多学科交叉与跨院系合作情况提供了一个新的评估角度。

科研竞争力的评价可以为科研决策提供必要的数据依据,但由于评价方法尚在探索过程中,评价过程也存在一些问题。例如评估中发现各数据库中的论文署名单位、各院系(实验室、研究中心)名称等信息都存在不规范的现象,特别是机构(或院系)英文名称不规范或科研人员的论文署名只包含实验室而未体现机构名称等情况尤为常见,这些因素都会影响到数据导出和分析的准确性。虽然通过人工的数据清理能够在一定程度上解决这个问题,但从根源上则需要各机构进一步规范其署名形式和要求,加强署名规范的宣传和培训,从而在今后的评估中得到更为全面准确的机构成果数据,使评估分析更为精准地反映实际情况。

此次科研竞争力评估是北京大学图书馆信息咨询部开展高端咨询服务的一次有益尝试,充分发挥了图书馆熟悉相关数据库与文献计量方法的特长,以客观、严谨的量化分析为学校的科研管理与决策提供了参考服务,同时也为进一步开展学科服务与高端咨询服务积累了宝贵的经验。机构的科研竞争力分析是一项很有意义的工作,图书馆可以在此领域继续探索,为更加知识化、专业化的服务奠定基础。

参考文献

邱均平,赵蓉英,余以胜.中国高校科研竞争力评价的理念与实践.高教发展与评估,2005,21(1):31-36

2 丁敬达,邱均平.科研评价指标体系优化方法研究——以中国高校科技创新竞争力评价为例.科研管理,2010,31(4):111-118

数学评价论文篇7

关键词:计量评价指标;影响因子;期刊建设

中图分类号:C93文献标志码:A文章编号:1673-291X(2011)10-0216-03

期刊计量评价指标能够及时反映期刊出版效果,已经日益成为衡量学术期刊办刊质量和学术水平的“标尺”。尽管以引证计量为主的定量评价方法存在某些不足,出现了过度延伸其适用范围,甚至单纯地“以数论刊、以刊论文”等不正常现象,但应当看到这是由于中国学术水平评价体系建设滞后,强迫期刊计量评价指标充当学术水平评价指标造成的,丝毫不能否定科学运用期刊计量评价指标在优化期刊资源配置、提升出版质量和水平、打造学术期刊国际品牌乃至使其做大做强等方面的重要作用。在提升学术期刊办刊质量方面,当务之急不是争论需不需要这些“标尺”,而是如何更加科学地选择、运用好这些“标尺”。

一、期刊计量评价指标

期刊计量评价指标是指主要用文献计量学指标反映人文社科期刊对知识创新的影响的评价体系,对总体评估人文社科期刊的学术质量、宏观考量人文社科期刊的办刊定位与出版策略具有重要意义。目前公认影响力最为重大的期刊评价“标尺”有三种,即CSSCI(中文社会科学引文索引) 、《中文核心期刊要目总览》及《中国学术期刊影响因子年报》(JIF),其中前两种也被普遍公认为“核心期刊”评价体系。

(一) CSSCI(中文社会科学引文索引)

CSSCI是“中文社会科学引文索引”的英文缩写,由南京大学中国社会科学研究评价中心开发研制。它采用数据统计的客观指标,从文献计量学的角度为学术成果评价提供参照,揭示科研成果的实际影响力,是科研工具性质的引文数据库。引文索引的主要功能是进行文献检索和科学研究关系的分析,是为科学研究与发展提供文献资料的重要检索工具,同时不可避免地延伸出一定的评价和推介功能。CSSCI在引文分析中对学术期刊的学术影响力进行测评采用了四种数据:一是绝对被引量,即某一学术期刊所发表的论文在引文索引中的被引用数量;二是相对被引量,即学术期刊近两年来的均篇被引率(又称影响因子);三是期刊的半衰期,即一种期刊在某一年度的被引总数中,较新的一半文献是在多长时间发表的;四是期刊的影响广度,即某一学术期刊在引文索引中被多少种其他期刊所引用。

(二)《中文核心期刊要目总览》

《中文核心期刊要目总览》(以下简称《要目总览》)是由北京大学图书馆与北京高校图书馆期刊工作研究会联合编辑出版的。《要目总览》采取多指标综合评价方法,将不同性质的因素组织起来,构成一个科学的评价体系,使不同性质的评价指标能优势互补,确保评价结果客观。2008年版《要目总览》采用了9个评价指标,分别是被索量、被摘量、被引量、他引量、被摘率、影响因子、获奖或被重要检索系统收录情况、基金论文比、Web下载量。在通过各种统计工具及方法获取这些指标的数据后,再采用模糊数学的方法进行综合处理,得出核心期刊的初选表,在此基础上再聘请专家进行定性评审,把定量评估和定性评审的结果进行方阵式排队,再将处于核心区的学术期刊称之为核心期刊。该指标体系覆盖面较广,全面反映了期刊被读者利用的情况,反映了期刊的整体学术质量。

(三)《中国学术期刊影响因子年报》(JIF)

2010年12月16日由清华大学中国学术期刊(光盘版)电子杂志社出版、中国科学文献计量评价研究中心与清华大学图书馆研制的《中国学术期刊影响因子年报》(以下简称JIF)系列数据库在北京首发。JIF系列数据库分人文社会科学卷和自然科学与工程技术卷。该数据库不仅公布了各期刊复合影响因子、期刊综合影响因子、基础研究影响因子、技术研究影响因子、人文社科影响因子外,还公布了各期刊总被引频次、被引期刊数、被引半衰期等数十个评价指标。JIF力求反映人文社会科学研究创新与人文社科文献出版的之间的存在的关系和特点,旨在客观、全面、规范、准确地报道人文社科期刊影响因子、被引频次、可被引文献量、下载率等期刊计量统计指标,并提供这些计量指标的文献统计来源信息,为学术的进一步研究和评价提供基本数据。

二、期刊计量评价指标的比较研究

通过对CSSCI 、《要目总览》及 JIF三种期刊计量评价指标的深入研究,笔者发现,两种核心期刊计量评价指标优势与问题并存。需要特别指出的是,在期刊评价的科学性、为各刊评价和改进办刊策略提供决策参考依据方面,JIF的优势更为凸显。

(一)CSSCI在期刊评价方面的优势及不足

1.优势。其一,CSSCI最为突出的优势是通过科学引文索引数据库的检索与查询,揭示已知理论和知识的应用、提高、发展和修正的过程,在为学术界从一个重要侧面揭示学科研究与发展的基本走向的同时,也为学术期刊把握前沿科技创新成果提供了参考。其二,通过科学引文索引数据库的统计与分析,可以从定量的视角评价地区、机构、学科以及学者的科学研究水平,为人文社会科学事业发展与研究提供第一手资料,方便了学术期刊有的放矢地进行选择出版资源。其三,CSSCI量化评价方法评价的客观性比较大,在其他评价体系人为因素干扰较多的情况下,用被引指数等客观指标来分析学术期刊的学术影响力,其可信度较高。其四,该评价系统采用四组数据来分析学术期刊的影响力,从影响强度、影响均度、影响时限、影响广度等多方面的定量评价学术期刊的影响力,较之单以载文量、摘文量、流通量、绝对引文量等单指标评价方法显得更加完善和科学。

2.不足 。其一,CSSCI最为核心的价值在于引文索引的主要功能是进行文献检索和科学研究关系的分析,是为科学研究与发展提供文献资料的重要检索工具,同时不可避免地延伸出一定的期刊评价和推介功能。然而CSSCI的这种最基本的作用在研究实践中并未真正发挥,居于次要地位的期刊评价及推介功能却被滥用,也就是说各界对于CSSCI严重使用不当。其二,CSSCI原始阶段比较粗放的按一级学科评选来源期刊的做法一直未能有效地改变,这就使得不是所有有影响力的学术期刊都能在CSSCI中找到自己恰当的位置,在一定程度上影响了其公信力。其三,从期刊评价及推介功能上讲,CSSCI的指标设计有漏洞,如指标的权重问题、期刊载文量的计算等问题,调研工作也没有及时跟进,使一些在学术圈内声名狼藉的期刊混入其中,因此应该增加“期刊同行评议”的指标予以弥补。其四,盲目推出“扩展版”,CSSCI来源期刊从2008―2009年起增设扩展版,首批扩展版收录期刊的数量为152种,并声明扩展版来源期刊遴选的标准仍坚持来源期刊的标准,同时兼顾地区和学科的平衡,其权威性受到质疑,得不偿失。

(二)《要目总览》在期刊评价方面的优势及不足

1.优势。其一,《要目总览》评价系统采用多指标进行综合的定量评估,再加上专家的定性评审,其优点体现在其评价的全面性上,克服了单指标评价片面性的缺陷。其二,2008年版《要目总览》的出版定位于为图书馆期刊订阅工作提供可资参考的工具,强化了其期刊订阅参考功能。《要目总览》的研制者能正视核心期刊的异化现象,主观上淡化了核心期刊“以刊论文”的学术评价功能。

2.不足。其一,定性评价本应是《要目总览》最为显著的优势,然而2008年版《要目总览》的定性评价体系却仍存在诸多问题,亟须完善。(1)《要目总览》很多评审专家是由期刊编辑部推荐产生的,其公正性值得怀疑。(2)应实行专家评审回避制度。有些期刊的主编、副主编、编委参与了所在期刊的学科核心期刊的评选,同时专家参与其所在单位主办期刊的学科核心期刊的评选的比比皆是。(3)学科核心期刊数量的确定应由《要目总览》课题组来确定,而不是由评审专家来确定。(4)综合性类目核心期刊应直接采取定量评价的结果。其二,评审周期过长,不利于持续地反映学术期刊办刊质量的真实水平,甚至给一些别有用心的投机者提供了可乘之机。有些投机者采取极端行为,先是花费巨资按照《要目总览》的计量评价指标包装某一学术期刊,同时利用《要目总览》定性评价方面的漏洞不惜血本地进行公关活动。一旦被包装期刊入选《要目总览》,就开始大幅度地膨胀期刊版面,在四年的评审周期中有恃无恐地收取巨额版面费。这样的做法严重危害了学术期刊的建设及评价工作,造成了极其恶劣的影响。其三,核心期刊总量增加过多。2008年版《要目总览》采取了与2004年版基本相同的方法,评出了1 983种核心期刊,但与2004年版的1 798种相比,却多出了185种,即比上一版增加了10.28%。

(三)JIF在期刊评价方面的突出优势

其一,JIF首次将中国学术期刊影响因子系列数据库整体,这基本消除了以前仅靠单一影响因子排名带来的不客观性。其二,综合各种指标对学术期刊进行计量评价,比单个影响因子的评价显然更为客观。在JIF系列数据库中,不仅各期刊文章被引用量和被哪些载体引用等各种数据一目了然,连单篇文章的被引用数据也能逐一查找。其三,中国现出版6 300多种学术期刊,JIF系列数据库囊括了其中4500多种期刊的各种评价指标,并根据“学术不端文献检索系统”,剔除了约7%的严重疑似抄袭、一稿多发文献的引用和被引。其四,该数据库还同时出版了“学术期刊个刊影响力统计分析数据库”详尽地提供了该刊统计年发表文献的参考文献、引证文献、下载频次、资助基金项目、出版时滞、学术不端检测指标,并可对所发文献进行学科分类统计、作者统计,并支持审稿人员审稿效果语法问情况的统计分析,为各刊评价和改进办刊策略提供了决策参考。

三、科学运用JIF计量评价指标提升办刊质量

通过上述比较研究,我们可以明确选用JIF作为衡量学术期刊办刊质量的计量评价“标尺”具有极高的科学性、客观性和可操作性。

(一)为获取高质量的学术论文提供了有效途径

学术期刊的编辑人员可以通过有的放矢地跟踪有较高影响因子学术论文的作者,密切关注其研究领域的学术前沿,积极与国内外从事该领域研究的专家、学者建立联系,或通过参加学术会议、上网浏览、深入国家重点实验室调研及亲自参与科学研究工作等多种渠道了解他们科研工作的进展状况和创新性,及时进行征稿,争取一些创新性强、学术性新、有新发现、学术质量高、内容有深度和广度的论文择优录用。通过所刊发论文的选题性强、学术质量高所产生的独特魅力吸引广大学术工作者的关注和兴趣,使其将本刊物作为他们开展科研或教学必须的文献资料加以研究吸收和参考,并在时引用这些文章为参考文献,达到提高本刊学术影响力的目的。

(二)可显著缩短论文的发表周期

科学技术突飞猛进,科技成果能否及时发表,直接影响着该成果的创新程度。一项创新性很强的科研成果或学术论文如果不能及时发表,拖延数月甚至数年,这就失去文章的时效性和成果的创新性,不但拿不到国内外的优先权,而且还有可能变成过时的垃圾信息。因此刊物的时滞也已成为评定一个刊物质量与水平的重要指标。为了持续地在JIF年报中获得较高排名,必然会要求期刊编辑部从根本上完善审稿流程和内部管理,为提高学术期刊办刊质量提供良好的制度环境。首先稿件要及时送专家评审,并督促专家尽快审回;审回的稿件要及时反馈给作者并督促作者限期修回并及时发表。

为了达到提高影响因子的目的,就必然要求学术期刊在编辑、出版的规范化建设方面迈上新的台阶。其一,有助于规范摘要写作。摘要是学术论文的重要组成部分,它用来报道论文所反映作者的主要研究成果,向读者提供论文中全部创新内容和尽可能多的定量或定性的信息,并阐明此研究工作的目的、方法、结果和结论。英文摘要是将期刊推向世界的重要手段,是学术期刊进入国际交流和被各大数据库进行检索的桥梁。要充分认识到英文摘要的重要性,要求以严谨、简明、确切、规范的英文摘要反映出文章的创新性和观点,以使读者能通过英文摘要了解文章的主要内容,获得尽可能多的信息,以尽可能多地被作者加以引用,扩大国际影响,从而达到提高影响因子的目的。其二,参考文献是论文的重要组成部分,它从某个侧面反映了研究者对研究现状的把握和对相关资料的占有程度,也反映了论文的水平和质量。为了提高总被引频次、影响因子,还必然要求规范所刊登论文参考文献的数量及著录方式。

(四)有助于打造一支高水平的编辑队伍

编辑人员自身水平的高低直接关系到选稿、审稿、定稿和编辑加工以及出版运行的科学、准确和速度。所以高素质的编辑人才是提高学术期刊质量和影响因子的基本保障。编辑人员要有扎实和宽阔的专业知识,合理的知识结构和敏锐超前的信息意识直接决定其能否准确地了解和把握本专业领域的前沿,制定出合理的、具有前瞻性的选题。编辑人员自身水平的高低还直接关系到对论文初审结果的科学性和准确性,要对本专业的专家所从事的研究方向及水平的高低等情况充分掌握,这是直接关系到对这篇论文初审情况的客观和准确性,取舍的合理性。编辑人员的专业知识的储备和博广,编辑业务的熟练程度和修改稿件的水平与能力,决定了编辑能准确把握稿件内容的前提下发现其中的问题并给予取舍和解决,并对稿件进行增舍性完善和加工,使其质量和价值升华,另外,编辑在最后的出版工作中能否对稿件文字表达和内容的科学性予以把握,这些与编辑人员的知识结构和业务水平密切相关。因此,必须有一支政治素质高、业务水平过硬的编辑队伍的勤奋工作和努力拼搏才能办出水平质量高、具有高影响因子的学术期刊。

参考文献:

[1]朱强,戴龙基,蔡蓉华,等.中文核心期刊要目总览(2008年版)[M].北京:北京大学出版社,2008.

[2]中国科学文献计量评价研究中心,清华大学图书馆.中国学术期刊影响因子年报:人文社会科学[J].北京:中国学术期刊(光盘 版)电子杂志社,2011.

[3]邱均平,李爱群,等.中国学术期刊评价的特色、做法与结果分析[J].重庆大学学报:社会科学版,2008,(14).

[4]弓箭.学术期刊影响因子的应用研究[J].农业图书情报学刊,2010,(7).

[5]叶继元.学术期刊质量评价与核心期刊评价之异同[J].图书情报工作,2009,(9).

数学评价论文篇8

关键词 中文图书 图书评价 评价体系 文献计量学

1.中文图书评价体系研究的目的和意义

图书是人类精神生活的必需品,在人类文明的传承中,起着不可替代的重要作用。在人类历史发展的长河中,曾经出版过的图书浩如烟海。如此众多的图书,如何选择,如何利用,对于图书工作者和使用者来说,始终是一个需要解决的难题。因此,在图书出版、传播和典藏的过程中,图书评价是一个不可缺少的重要环节。图书发展的历史,就是一个不断编制、出版发行、筛选、典藏和淘汰的过程。

但是,长期以来,国内外对于图书评价的研究,由于其出版数量巨大、种类繁多,相关数据统计困难等诸多原因,无论在理论探讨还是实践应用方面,都相对薄弱和滞后。图书评价的主要方法基本仍停留在传统的定性分析层面。这种方法,虽然有一定的权威性和易操作性,但往往规模较小,且带有主观随意性和不确定性,缺少定量化的精度和力度。

为了促进新环境新技术下的我国图书出版事业有序发展,增强我国图书出版的持续创新能力,提高我国图书出版的整体品质和市场竞争力,提高我国的全民阅读素质,我们需要通过研究建立一个科学、合理、客观的图书综合评价体系,能针对图书的不同类型、特点和功用选择不同的指标,从多个角度对图书的质量以及在社会生活和科学活动中的作用做出全面、客观的评价,以得到改进和完善图书出版质量的方向和途径,同时,更好地发挥图书的文化价值和社会效益。

2.图书评价文献计量理论依据

文献计量统计研究证明,文献的许多特征是有规律的。如:英国文献计量学家布拉德福发现学科论文在期刊中的分布规律:对某一主题而言,将科学期刊按其登载相关论文数量的多少依次递减排列时,可以分成对该领域论文有显著贡献的核心区,以及与该区论文数量相等的几个区,这时核心区与相继各区的期刊数量成1:n1n2……的关系。布拉德福在此首先提出了核心区的概念,后来的研究者们将这部分位于核心区内的少数“信息密度大、载文量多”的期刊称之为核心期刊,而布氏揭示的这一规律也被后人称之为布拉德福文献集中与离散定律。

美国文献计量学家加菲尔德发现了引文分布规律:大量的引文都集中在多个学科的一小部分核心期刊中,而少量的引文则散布在大量的期刊中,因此,一个基本的、集中的期刊集合,就可以代表所有学科的核心。这一“集中效应”具有长期的稳定性,并不随时间推移呈现出显著变化。这就是著名的加菲尔德文献集中定律。

美国文献学家特鲁斯威通过对文献使用情况的统计分析,发现20%的馆藏,就可以满足80%的流通需求。他据此认为,帕累托的80/20定则同样适用于图书馆活动,并可用作确定图书馆的核心馆藏的参考。同样地,图书使用情况也存在类似的核心效应。

上述研究揭示了文献的使用特征确实存在集中和分散的规律,即少数文献集中了大量的使用量,而其他大多数文献只具有少量的使用量,因此,我们认为,文献计量学的研究方法,同样适用于图书评价研究。我们完全可以采用文献计量统计的方法对图书进行评价,筛选出少数使用量和影响力都较大的核心图书。

3.中文图书评价体系研究原则与方法

要构建科学合理的图书评价体系,必须充分考虑不同类型和范畴图书之间的差异,采取理论与实践相结合、数据和事实相结合、定性和定量相结合的评价方法,全面兼顾各类型图书的外在形式、内在质量、使用规律等各方面,设计互为作用和补充的多个评价指标,形成一套能达到最优化评价效果的多元互补的综合评价体系。因此,我们在研究建立中文图书综合评价指标体系时,应大致遵循以下3条基本原则。

(1)明确评价对象,分类型分学科进行评价。

图书品种繁多,包括各种类型。有学术理论专著、实用技术图书、科学普及读物、大众通俗读物等等。不同类型和范畴的图书,彼此之间存在着巨大的差异,内容各不相同,特性也各不相同,很难用统一的标准来进行评价和衡量,因此,我们在进行图书评价时,应针对各类型图书的特点,设立不同的评价指标和评价标准,进行分类型分学科的评价。

(2)多指标综合评价。

要对图书进行实事求是的评价和分析,建立一个科学的评价指标体系是评价成功的关键之一。能反映图书质量和水平的因素很多,因此,在构建图书综合评价体系时,必须针对不同的评价对象和评价目的,进行全面分析,从多个角度考虑设置评价指标。在评价指标选择完成之后,还需要认真分析选择评价指标统计源,只有以准确客观的统计数据为基础,才能得到科学合理的评价结果。

(3)定量评价和定性评价相结合。

图书的定性评价方法是由学科专家根据自己的知识和经验,对图书的价值做出主观判断的方法。它的优点是简单易行,权威全面,但往往也会受限于专家的个人学识、偏好等因素,带有一定的随意性和不确定性。而定量评价方法强调数据计算,具有客观化、精确化、标准化的特点,但同时也会因为选取的评价指标自身的完善程度、统计数据的质量水平等种种原因产生偏差。所以,无论是定量评价方法还是定性评价方法,都有其优点,也都有其局限性。正因为此,科学合理的图书评价体系,应考虑从多维度视角对图书进行评价,努力将各种指标数据与专家评议与用户评议有机结合起来,寻求两者平衡的最佳结合点,以求得到更客观、更公正的评价结果。

4.构建中文图书综合评价体系

根据上述中文图书评价体系研究总体原则,我们通过“德尔菲专家调查”和“层次分析”相结合的方法,综合考虑图书评价的各方面因素,构建了一个多层次、多方位的中文图书综合评价体系,其基本框架如图1所示。

其中,有关图书编辑质量的评价在图书的质量管理规定中都有较成熟的标准和规范,我们就不在此详细论述了,重点介绍有关内容质量评价部分的设想。

如何对图书的内容质量进行客观合理的评价,是一项非常复杂和困难的工作。我们认为,主要可以从两个方面着手,一是对图书的内在价值的评价,包括对图书内容的思想性、创新性、科学性、艺术性、学术性、知识性、实用性等多个方面的分析比较;二是对图书的使用价值的评价,主要体现在图书的影响力和满足社会需求的能力上。对这些价值和效应的评价,其中有些可以通过定量指标来进行量化测算,有的则是难以计量的。因此,我们在构建中文图书内容质量的评价体系时,选择了定性评价和定量评价相结合的方法,来综合考虑对这两方面因素的评价。

4.1定性评价方法和指标

定性评价是指根据人们的经验和主观认识来直接判断和确定图书价值,与定量方法相比,它更强调对评价对象的主观观察、归纳、判断、分析,侧重于对图书难以量化的内在价值部分的把握,因此,我们在设计确定定性评价指标时,更多考虑的是从宏观角度出发,从整体着眼,努力平衡指标的“充分性”、“通用性”和“适用性”,使得评价指标体系既能满足多样化需求又同时具备可行性。

“中文图书综合评价体系”在评价图书内容质量方面共设置了“思想性”、“科学性”、“创新性”等8个定性指标,基本涵盖了评价质量所需的各个方面。

如何使用上述定性评价指标对图书进行综合评价,也是一个值得探讨的问题。一般我们可考虑采用两种不同的方法。一是将各个具体指标根据重要程度的不同赋予不同的权重,然后请专家根据各个具体指标进行评分,评分结果直接纳入评价数学模型。这种方法数据更为精准,但操作难度大,可行性较差。第二种方法则是由专家根据上述各个指标,结合对该图书的整体认识,直接给出综合评价结果,这种方法易于操作,更适用于较大规模的评价,但缺点是在精准性上有所欠缺。

4.2定量评价方法和指标

定量评价主要是通过对图书或与其某部分特征相关的定量指标进行文献计量统计和数据分析,来评价图书的使用价值和社会功用,它更强调数据统计和计算,具有客观化、标准化、精确化等优点。

在定量评价指标方面,我们共设立了8个指标。包括:

(1)被引频次。指被评价图书在统计年限中被期刊或其他图书引用的次数,以此来表示该图书在科学学术交流中被利用的程度。

(2)借阅频次。指被评价图书在统计年限中在图书馆等文献情报机构被读者借阅的次数,它从一个角度反映了该图书的被使用情况。

(3)被摘频次。指被重要检索工具摘要或书评的次数。

(4)网络下载频次。网络信息技术的发展为图书的使用和阅读提供了一个极具发展潜力的平台,图书的数字化出版、网络化传播日益广泛。为了适应这一新的趋势,我们在计量评价时,也设立了相应的网络下载频次指标,通过统计图书在互联网上被下载阅读的频次,反映图书在互联网上的传播情况。

(5)获奖频次。指在图书评奖活动中的获奖次数。它能从一定程度上反映图书本身的质量和社会对其的评价,可以借鉴吸收其他项目的图书评价成果,进一步提高对图书质量的评价作用。

(6)出版次数。指图书再版的次数,是反映图书被利用的持续程度的重要指标。

(7)发行数量。指图书销售发行的册数,它通过读者的消费体现图书的价值和影响,直接从市场角度反映了读者对图书的认可情况。

数学评价论文篇9

刘 尧

提要 本文针对教育评价相关关系不清的总是从多角度对此进行了辨析,并对教育评价学科群的建设,提出了许多有益的建议。

关键词 教育测验 教育测量 教育评价

作者 刘尧 浙江师范大学教科所副研究员(金华 321004)

教育评估、教育评价是20世纪30年代在美国兴起,60 年代兴盛于西方世界并传入我国。这些学科虽然在我国大力发展已有20余年,但理论

研究的进展不大,学科的成熟度不高,与我国广泛开展的教育评价活动很不适应.我国各省市都有考试院(中心),也成立了许多评估、评价机构,广泛展开了对教育测评估评价活动。而与此相应的教育测验、教育统计、教育测量、教育评估、教育评价理论很不成熟.尤其值得重视的是教育评价与教育研究和发展,以及对教育评价实践的指导.鉴于此,本文对与教育评价相关概念进行简述和辨析.

一.关于教育评价相关概念简述

教育测验:即为考试,它是对人的知识、技能和能力以及某些心理特征的测量。考试是教育评价的一种手段。考试是个系统,它由主考、

被考(考生)、试卷(试题的集合及其评分标准)、考分四要素组成。考试的过程就是主考组织编制试题,通过试题作用于被考,将正确答案、评分标准与被考的反应(答案)相比较,然后给出考分的过程。考试从宏观上可分为社会考试和教育考试两大类。教育考试又可分为校内考试和校外考试两类。按考试分数的解释与使用,可分为常模参照性考试和标准参照性考试。按考试对象分,有学业的成就考试、学术能力倾向测验(其目的在于测量考生学习的潜在能力、发展倾向,如音乐能力倾向测量)、人格测验(如测量态度、兴趣、情绪、性格等).按测验人数分,有个别测验、团体测量.接测验方式分,有纸笔测验(用笔时试卷作答)和非纸笔测验(如口试、实验操作、表演等)。其它可分为难度测验、速度测验、总结性测验、诊断性测验以及大规模测验(其成绩的使用有权威性,要求严格,标准化程度高)、教师自编测验(即教师自编用于课堂教学的测验)等.[1]

教育统计(学):运用数理统计学的原理和方法研究教育现象中的数量关系的一门应用学科。它通过数据的分析和处理,准确地掌握教育

情况,为制定教育方针、政策提供科学依据,为开展教育科学研究,探索教育规律,制定教育方案,检查教育效率提供科学方法,也为教育管理和教育评价提供有效的工具.它分为两大类:一是描述统计学,研究简缩数据和描述这些数据,二是推断统计学,用数据进行统计检验,统计分析和非参数统计法作出决策。前者只是分析某一样本的特点,而后者则是通过抽取母体的一个样本,并以此样本为根据来分析母体的特点.它是在教育问题的研究中,描述样本,分析样本,分析样本与总体的关系,从而进行教育科学推论的一种原理和方法.其研究方法一般有:大量观察法、统计分组法、综合指标计算法、统计资料检验法、统计资料图示等。[2]

教育测量(学):研究如何测量学生的学业成绩、学习能力、兴趣爱好、思想品德以及教育效益等问题的一门教育学科。它运用各种测量

手段和数理统计方法等数学工具,根据教育目标或教学计划的要求,研究如何测量和评价教育效果,如何编制测量计划,各种类型试题的优缺点,衡量一个学业成绩测验好坏的数量指标,如何进行测验结果的统计分析,测验分数的解释和评价等.其主要内容包括:测量原理、项目分析、效度、信度、标准化测验、测验的设计和编制、测验的常模、测验的实施和评分、测验结果的解释等。[3]

教育评估:是一种有系统地去寻找并搜集资料,对评估对象作预测性、估计性的评判,以便协助教育决策者从若干种可行的策略中择一而

行的过程.在我国教育评估与教育评价不作严格区别,在实践中具体运用时,不同的范围和场合有不同的习惯用法.如高等教育中多用评估,在督导部门也称督导评估,而在普通教育领域多用教育评价不过两个概念是有一定区别的.评估有估价的含义,较为模糊粗略,而评价相对而言是较为精确的价值判断,评估多用于群体或单位的状态及效果的估价,而评价则既有对群体和单位的价值判断,也有对个人的判断.教育评估的一个重要目的就是为教育决策提供重要依据,国家教育管理部门要根据教育评估的结果,及时调整教育的决策。教育评估的结果对国家、对学校都是一份咨询材料,而不是行动纲领.[4]

教育评价(学):以教育为对象,研究各类教育目标与相应的教育现象之间的关系,并给予一定的价值判断的学科.它的研究范围可划分

为:宏观教育评价(研究教育思想评价和教育制度评价)和微观教育评价(研究学校教育系统内部各类教育思想和教育活动的评价,如学校办学思想、学校领导管理质量、教师教育和教学质量、学生德智体全面发展质量的评价等)。它的基本范畴是:教育评价的对象,教育评价的范围,教育评价的模式,教育质的规定性评价,教育量的规定性的评价,教育质和量变化的度的评价,教育评价的指标体系,教育评价的类型.其研究的基本原则有:客观性原则、理论联系实际原则、发展性原则和联系性原则.其种类包括目标评价、过程评价、条件评价、贡献评价等.[5]

教育评价(学):教育评论学是研究教育评论现象和教育评论活动规律的科学.或者说它是研究教育评论的历史、现状,教育评论现象的

本质联系,教育评论工作的性质、任务和作用,以及教育评论工作的原则、方法的科学.教育评论学是与教育理论、教育史并列的一门教育学科.要建立教育评论学的学科体系,必须解决两大难题,即建立教育评论学的范畴体系和概念体系,并给予科学的揭示和阐述,使这些概念和范畴形成一个有机整体.同时,还要运用这些概念、范畴及其所固有的内在联系,采取科学的方法论证教育评论活动中最普通、最一般的科学原理;从而揭示出整个教育评论活动及其形成和发展的基本规律。教育评论学的研究对象和任务,从根本上规定了教育评论学的学科性质和范畴.首先,教育评论活动是一种教育科研活动,它的直接结果是鉴别、评判教育文化的优劣,进而对教育界产生社会舆论导向作用;而教育文化本身及其所产生的依附于受教育者身心的精神产品,都属于意识形态范畴,可见教育评论家属于研究意识形态和揭示教育评论活动的本质规律,建立完整的教育评论学学科体系。所以,教育评论学也属于基础理论学科。再次,教育评论学的研究对象决定了教育评论学涉及整个教育领域,内涵十分丰富。也可从不同视角,针对不同范畴建立多部门、多层次的分支学科(如:教育理论评论学、教育史评论学、教育行政评论学、教育家评论学等),所以教育评论学又是一门综合性的学科[6]

二、关于教育评价相关概念与教育评价的关系

教育评价与教育测验的关系:教育测验是对人的知识、技能和能力以及其他某些心理特征的检测,是教育评价的一种手段,确切地说它是

教育评价获得评价信息的工具之一.教育评价获取信息的测验法就是来自于教育测验.

教育评价与教育统计的关系:教育统计是运用数理统计的原理和方法研究教育现象中的数量关系,通过数据的分析和处理确切地掌握教育

情况,也是教育评价的一种手段和工具。教育评价中获取信息的统计法就来自于教育统计。

教育评价与教育测量的关系:教育测量通过对学生知识的掌握、智能的发展、思想品德的变化、体质的状况以及教育活动的各个方面的测

定,为教育评价提供依据,是教育评价信息的主要来源.如果没有教育测量提供的资料,教育评价将成为无源之水,失去了作价值判断的依据,其科学性、准确性便无从谈起。另外,教育测量的结果只有通过教育评价才能获得实际意义,成为改进教育工作有参考价值的信息.[7]

教育评价与教育评估的关系:教育评价与教育评估是非常相近的两个概念,在许多场合是通用的。评价是精确的价值判断;而评估是估计

的、预测性的价值判断。在我国从政府的文件到学者的文章论著,以及教育实践都把评估与评价混用。我个人倾向于把教育评估的对象限定在以宏观、中观的复杂教育系统的战略性、预测性估价方面,对于微观的较简单的教育系统的过去和现存实态则作为教育评价的对象。

教育评价与教育评论的关系:教育评论是对教育文化的反思和展望,它的对象是以教育文化中的精神文化和制度文化为主的,以真善美作

为评论标准的观念活动。严格讲它与教育评价虽只一字之差,但它与教育评价分属于教育科学的不同领域,有着重大区别。比如,教育评价是一种管理活动,而教育评论则为观念活动;教育评价由评价机构按严密的程序实施,而教育评论则由教育评论家个人采用灵活多样的方式方法评述;教育评价有明确的指标体系并要求量化,而教育评论无需指标体系更不用量化,教育评价的对象是具体的可控的,而教育评论的对象是抽象的,不可控的;教育评价的结果多用于改进工作,而教育评论的结果则多用于改变观念;等等。这不是说教育评价与教育评论一点关系都没有,它们的关系表现在教育评价的结果可以成为教育评论的论据影响教育评论,而教育评论的结果可以作为教育思想观念影响教育评价所依据的教育价值观。

三、从价值论角度看与教育评价相关概念的区别

唯物主义的价值论认为,价值判断和事实判断是人们把握客观世界和两种不同方式。两者反映的对象、意义和参加的心理成份都有着质的

区别。事实判断是以客体的本质和规律为对象的,它探讨客体“是怎样的“、”是什么“,探讨事物的现象、本质和规律等实体属性,即以理性认识这种抽象思维形式反映客体的本质及其规律。而价值判断是以客体与主体需要的关系为对象,它探讨客体的价值属性,即客体的社会意义------对社会需要意味着什么,它以多种意识形式-----认识(价值与事实判断)、情感(对价值的态度体验)、意志(对价值的自觉保证)等诸种形式的综合来反映客体与主体需要的关系。

从前面的分析可以看出,教育评价对评价的对象不仅要借助教育测验、教育统计、教育测量进行量的测定和分析,而且要进行质的分析,

把所有考查绩效的材料和分析综合起来,在多大程度上达到了预期的目的作出价值判断。从这里可以看出,教青评价行为是建立在事实判断基础上的价值判断.教育评价中的事实判断在于诊断与鉴别教育的性状,价值判断则是对诊断鉴别而得的结果或结论,按其价值取向进行合乎目的的推断和判断;事实判断是价值判断的基础,价值判断是事实判断的目的性追求。而教育评论是依据一定的教育价值观和教育价值取向,对教育的一种价值判断。从教育测验到教育评论是一个由事实判断向价值判断的变化过程,我们不能说教育测验丝毫没有价值判断,如在测验什么不测验什么的问题上是有价值判断的;同样,我们也不能说教育评论就无点滴的事实判断,教育评论需要通过事实判断的真凭实据作论据。

四、对教育评价学及其学科群研究的建议

教育评价学经过几十年的发展已初步形成了学科体系,尽管概念、体系有待完善,但已为下一步的研究打下了坚实的基础。与此相应的考

试学(研究教育测验的学科)、教育统计学、教育测量学、教育评估学、教育评论学都已有相应的发展,形成了一个共生的教育评价学科群。21世纪,要使这个学科群得到良好的发展,我认为首先对各个学科的研究范围有个明确的划分,尤其是对教育评价学要有合理的定位,不要再把考试学、教育统计学、教育测量学的内容纳入自己的努力范围,要让它们以独立的学科更好地为教育评价学服务。另外,教育评价学还要把属于教育精神文化、制度文化类的抽象的,教育评价无力评价的范围还给教育评论学,让教育评论学更快地发展.同时,要把教育评估与教育评价的关系处理好,可将两者合二为一,形成统一的学科.其次,各学科要明确自己的研究对象,形成概念体系和学科体系,把一些已成熟的概念和理论约定俗成稳定下来,逐步形成相对稳定的学科知识和概念体系。第三,要处理好理论与实践的关系,加强理论研究,使其适应实践的要求,要积极总结实践经验并升华为新的理论,丰富和发展教育评价学学科体系.第四,要处理好引进与消化吸收的关系问题。无论是从国外引进的教育评价学理论,还是从教育科学界以外引人教育的评价理论都要结合我国的教育理论和教育实践,进行修正使其“本土化”和“教育化”。

综上所述,搞清教育评价相关概念的关系,对理清教育评价学科群内各学科的关系,促进该学科群的发展,为丰富和发展教育科学,加快

教育事业的发展有重大的理论和实践意义。

数学评价论文篇10

关键词:图书馆,电子资源,绩效

 

图书馆在建立了大量的诸如电子期刊、引文数据库、全文数据库等电子资源收藏的同时,必须重视电子资源的利用效率、效能和价值,提高电子资源服务质量和用户满意程度。寻求有效的评价和管理电子资源的办法正成为当前大学图书馆的主要挑战。

一、国外电子资源绩效评价的研究现状

国外关于电子资源绩效评价的研究始于上个世纪九十年代末。1997美国学者Smith和Rowland首先提出应该开展电子资源绩效评价问题研究,衡量电子资源的服务情况。1998至2000年期间,John Carlo Bertot和Charles R. MeClure (1998a,1998b,1998c,2000)等研究专家组进行了美国公共图书馆网络统计和绩效评价方面的研究,主要研究成果《公共图书馆网络服务的统计和绩效评价(Statistics and Performance Measures for PublicLibrary Networked Services)》 (Bertot,Me Clure,& R yan,2001)在美国图书馆协会(ALA)上出版。他们定义并通过了国家公共图书馆采集数据测试新的网络统计和绩效评价系统,以便能最终适用于部级数据采集。论文格式,绩效。此外,Bertot为美国图书馆和信息科学委员会(NCLIS)开发了一个系统工具,从提供商层面研究在线数据库利用统计和评价,测试公共图书馆网络性能以及基于网络的服务,进一步了解本地、全州和全国范围的统计数据采集元素的需要,并重点了解不同水平图书馆的网络资源、服务和基础设施评价的需要。从上世纪90年代中期开始,在Bertot和Mc Clure等专家的前期理论研究基础上,国外就“电子资源网络统计与绩效评价”“电子图书馆服务绩效评价”等方面开展应用性研究项目。其中比较有影响的近10个关于电子资源的网络统计和绩效评价的项目在美国和欧洲等国家图书馆界相继启动。

二、国内电子资源绩效评价的研究现状

国内较早探讨电子资源评价问题且较有代表性的研究文献,有李青华(2000)的《高校图书馆电子文献与虚拟文献评估方法探讨》,针对不同类型电子资源分析出不同的评价要素,根据数据库数量对应的信息含量、信息获取能力和利用信息的总条件,来衡量电子文献获取和利用的总水平。在评价方法方面,做了一定的理论探讨,分别提出了电子文献、虚拟文献评估指标体系和测算方法,构建了文献获取和利用总水平的评价模型。但是,研究中没有考虑服务质量和价值因素,至于对评价结果起重要决定因素的获取能力折算系数值如何确定、如何获得统计数据等没有提供理论依据。论文格式,绩效。

张咏(2001)在《网络信息资源评价的方法及指标》中,对网络信息资源的评价方法和评价指标进行综述。黄摘(2001)的《图书馆电子资源的引进和管理》、张会田(2002)的《馆藏数字化资源评估方法探讨》都在不同方面探讨了在购买和使用电子资源过程中,应该评价和考虑的因素问题,对图书馆的数字资源评估方法做了理论上的一些探讨。肖希明(2002)在《网络环境下的馆藏评价标准》中讨论了传统的馆藏评价标准的局限性问题,提出网络环境下图书馆馆藏评价的标准,着重于对图书馆信息资源的保障能力、信息资源的质量、信息资源的共享和信息资源的利用率四个方面的评价。

针对大学图书馆电子资源的建设与管理实际,北京大学肖珑、张宇红(2002)所做的《电子资源评价指标体系的建立初探》,较为系统地把电子资源的评价指标归纳到电子资源摘要因素引入到电子资源评价指标中。刘锦山(2003)对电子资源评价指标做了更进一步的定量描述,建立了包括读者满意度和利用情况共15个电子资源评价的定量指标,这些定量指标可以从方方面面较为准确地去评价电子资源。论文格式,绩效。在此基础上,张李义(2004)进行了《高校图书馆商业数据库评价指标体系研究》,建立的引进数据库资源的评价指标体系,包含数据库内容、检索系统、使用情况、性价比和服务五类19个指标,既有定性也有定量指标。这些前期的电子资源评价指标体系的研究都为我国大学图书馆的电子资源绩效评价理论研究奠定了一定的基础。

三、对现有文献的评述及研究展望

综合上述国内外相关研究文献内容,电子资源绩效评价始于上世纪90年代末期,无论是国内还是国外,都是图书馆情报学界的一个全新课题。论文格式,绩效。尽管国外开展了一些项目研究,但至今对于电子资源以及绩效的概念国内外也不统一,从系统的评价理论框架体系到指标体系和评价方法研究都存在着空白领域,主要表现在以下三个方面。

1.基础理论研究不系统

在基础理论研究方面,国内还没有出现系统地进行电子资源绩效评价理论及方法研究的文献。至今为止,我国高校也没有形成统一的电子资源绩效评价指标体系,国内的研究主要集中在电子资源评价指标内容和构建指标体系的探讨阶段。从研究文献可知,学者提出的能够反映电子资源绩效的指标共有近四十个,庞大的指标个数不仅增加了综合评价和数据分析的复杂性,而且在我国大学图书馆缺乏常年积累的电子资源使用统计数据情况下,其中大量定量指标是图书馆根本无法获得的评价数据。

2.研究方向不明确

国外电子资源评价的重点和核心是建立在电子资源利用网络统计数据基础之上的绩效评价与分析,已经取得了一些初步成果。从Terry Plmu (2005)的最新研究成果报告《Evaluating the Usage of Library Networked ElectronicResources》中了解到,该项目正在确定数据商提供评价支撑的相关统计数据的标准,重点进行电子资源利用统计数据的自动收集技术研究。就目前来看,我国关于电子资源绩效方面的研究内容、研究方向以及研究重心都还未明确。

3.应用研究不成规模

国外对电子资源的绩效评价己从基础理论研究进入应用研究阶段。以图书馆学术团体或图书馆联盟或一些机构为主要研究者,并以联合性的大项目研究居多,有些项目有数十个图书馆参加,有数据商协助配合。论文格式,绩效。相对而言,我国的研究者多为图书情报领域的研究人员和图书馆馆员,以个人(文献)方式研究者为主,相应的成果主要是理论探讨形式的论文,真正进行电子资源绩效研究的项目和组织还未形成,也没有实质性的应用研究。

综上所述,我国对于大学图书馆电子资源绩效评价研究基本上还处在探讨阶段,没有突破国外的研究成果,或对其成果的介绍,或对网络信息资源内容质量的评价,并且仍停留在对传统图书馆的服务绩效评估理论上。论文格式,绩效。与国外利用先进的方法和手段,从理论研究到应用研究的严谨性和实践性过程相比,我国已开始指标体系的构建,但理论过于抽象、方法传统,在系统的电子资源绩效评价理论体系框架和评价方法研究方面,存在着许多差距和研究空白。大学图书馆的绩效评价必须建立完整的分析性思维模式和系统的方法,进行科学设计并进行反复实际测试、调整,以形成适合我国国情的大学图书馆绩效评估指标体系。因此,对于绩效评价指标的可操作性研究,对于电子资源绩效评价模式的可应用性研究,对于评价结果的分析和解释方法研究等,都将成为我国大学图书馆电子资源绩效评价最终能否付诸于实践需要函待解决的关键问题。

参考文献:

1.Bolton,R. N. and Drew, J. H .A multistage model of customers’ assessments ofservice quality and value. Journal of Consumer Research. 2008 (17):375-84

2.余恒鑫.中文电子期刊数据库评价指标体系研究.东北师范大学,2005

3.张会田.馆藏数字化资源评估方法探讨.图书情报工作,2008(5):50-53