对行为科学理论的评价十篇

时间:2023-11-10 18:15:08

对行为科学理论的评价

对行为科学理论的评价篇1

关键词:评价 评价学 人文社会科学评价 评价活动

中图分类号: G250.25 文献标识码: A 文章编号: 1003-6938(2012)05-0133-04

2012年1月出版的《人文社会科学评价理论与实践》[1](套装上下册)(以下简称“本书”),是邱均平教授继《评价学:理论·方法·实践》[2]之后,又一评价学方面的力作。本书系国家社会科学基金重点项目“我国人文社会科学研究评价体系的构建与实证分析”(05AZX004)的研究成果之一,结项鉴定为“优秀”,被免评审进入武汉大学学术丛书正式出版。本书也是邱均平教授领导的“武汉大学中国科学评价研究中心”团队在近十年的研究及实践基础上撰著而成的,是目前国内第一部全面、系统地对人文社会科学评价的理论进行深入研究,并将相关研究成果用于评价实践的著作。本书在人文社会科学评价理论、人文社会科学评价体系和人文社会科学评价实践三个方面创新性研究,从而构建了一个包括理论、方法与实践相结合的人文社会科学评价体系。细细读来,抽丝拨茧;慢慢品味,高屋建瓴,实感受益匪浅。

1 关于人文社会科学评价理论的创新与价值

1.1 超越科学评价研究,创新人文社会科学研究评价理论体系

本书作者亲身参与和经历了我国科学评价工作发展的过程,并且紧跟国际该领域的研究与发展,充分把握国外科学评价领域的研究和国内研究现状。通过对国内外研究现状与相关研究成果及文献的梳理看到:目前,科学评价工作偏重于科技评估方面,而人文社会科学研究评价领域大多数的论文都是成果评价方面的,且数量相对较少,不全面、不系统,远没有形成一个人文社会科学研究评价理论体系。

然而,在整个科学体系中,人文社会科学占有重要地位。随着人类社会的不断进步,人文社会科学发展的重要性和迫切性更为突出了。人文社会科学研究评价体系是对人文社会科学研究活动及其结果进行评估、管理的基本依据;其评价工作是人文社会科学事业管理的重要组成部分;也是规范和促进人文社会科学健康、有序发展的不可缺少的重要措施;建立人文社会科学研究评价体系是重视和尊重人文社会科学的具体体现;我国人文社会科学事业的繁荣发展迫切要求加强人文社会科学研究的评价体系建设。但是,我国人文社会科学研究评价体系的建设与自然科学相比,与国际通行惯例相比,尚存在很大差距,已经成为阻碍人文社会科学研究进一步发展的瓶颈问题,亟待研究和解决。

因此,本书超越科学评价研究,建立与完善了人文社会科学成果的评价机制、评价标准和评价体系,是对人文社会科学研究评价的创新。

1.2 创新人文社会科学评价机制,为保障评价公正性提供理论指导

(1)发现信息传导机制,深化评价过程认识。本书强调“信息”要素在评价活动中的重要作用,从信息管理学的角度,对评价过程中的“信息”要素的运动规律加以分析,并通过与典型的通信系统理论模型[3]进行对照,发现评价活动中的要素与通信系统模型中的若干要素存在着强对应关系。在对“评价”作为信息过程进行了重新认识的基础之上,分析了科学研究对“评价”的需求,以及同行评议、定量评价指标的“”角色。形成了对科学研究评价更为本质、更为深入的认识——信息传导机制。

(2)指出“公正”是评价的根本要求,系统完善了“公正机制”。在详细系统讨论了程序公正机制、利益约束机制、元评价机制等“公正机制”之后。强调了“元评价”对于保证评价的科学性、公正性的指导与约束作用,指出在我国的人文社会科学研究评价体系中亟待建立有效的元评价机制。提出了对评审专家的专业水平、评审态度、信度等信息,应该纳入一个可以在学术界共享的、保存有连续累积数据的数据库系统中,纳入到一个信誉、信用管理机制当中的思想,并最终实现了人文社会科学发展与评价信息系统集成平台的构建与应用。

1.3 全面分析我国人文社会科学研究评价的环境,奠定人文社会科学研究评价理论的现实基础

人文社会科学研究评价要受到外部环境因素的影响,然而在现实的研究中对这些外部因素及其影响的研究呈现单向度性,缺乏系统性分析。因此,本书对人文社会科学研究的性质、特点;特殊国情、文化、科技政策、学术规范;科学的整体社会建制等人文社会科学研究评价的外部环境因素及其影响进行了分析。

从人文社会科学自身所具有的复杂性和模糊性、真理性检验的直观性、价值实现的潜在性和间接性、民族性、本土性以及成果多样性和引文的长周期性等特点的分析,指出人文社会科学研究评价可以借鉴、但不能照搬自然科学的评价方法,应该根据其特点进行调整;从“大科学”与科学建制化、“大科学”下的“小科学”、科学承认、奖励、资助与报酬体系几方面的分析,指出在人文社会科学建制化背景下,评价活动必须坚持评价的学术性,恪守“学术自由”这条底线,维护学术共同体内的固有规范和秩序;从人情关系的社会文化和“人治”传统的分析,指出在评价体系别需要体现“公平、公正、公开”的规则意识,坚持评价标准的学术性、独立性、自主性,保证评价过程的公平、客观和规范性,注意评价标准的质量导向性;从人文社会科研究规范缺失的现实的分析,指出学术规范与学术评价之间存在互动关系,学术规范的普遍遵循,是学术评价有效性的基础和前提,学术规范缺失影响着人文社会科学评价,制约了学术评价体系的完善,同时要求学术评价本身要规范,在评价标准中要将学术研究的规范性列入重点考量,或将研究的规范性作为评价的前提。从而奠定了人文社会科学研究评价理论的现实基础。

2 关于人文社会科学研究评价体系的创新与价值

构建人文社会科学研究评价体系是一项庞大的系统工程,本书分十章进行了系统的创新性研究。从分析我国现行的人文社会科学评价体系入手,探讨了其核心体系,介绍了其要素体系,健全了其分类体系,构建了其运作体系,提出了其指标体系,并对人文社会科学人员评价的指标体系,以及成果、机构、项目的评价体系等内容进行了深入研究。从而对我国现行学术评价体系的问题进行了反思,并提出了对现行评价体系的改进思路。

2.1 构建核心体系,奠定人文社会科学评价体系基础结构

本书基于学科、应用、具体评价活动过程等三个方面,构建了包括基础理论、评价方法和学科理论的完整的、有机的科学评价理论体系;着眼于人文社会科学与社会的互动关系,梳理了包括国际/国内、宏观/外部、微观/内部环境,以及社会评价意识等人文社会科学研究评价的环境体系;基于科学评价体系选择的标准与模式问题的讨论,构建了狭义的和广义的评价活动体系;从科学评价规范与科学评价管理监督机制的关系分析,构建了科学合理、健康完善的评价规范体系。从而构建了包括理论、环境、活动、规范体系的人文社会科学评价核心体系,为其他体系的建立奠定了基础。

2.2 总结归纳评价的要素体系,健全了评价的分类体系

人文社会科学研究评价包括了,评价主体、目的、对象、标准、内容、指标、方法、程序,以及评价数据与结果等要素,在之前的研究中缺乏全面的系统研究和归纳总结,本书对其进行了全面系统的研究。这一研究的价值不仅仅在于归纳总结评价的要素体系,它还是健全和完善评价的分类体系的基础。在评价过程当中对于评价要素的不同偏好偏重、关注程度、要素组合等都对应着不同的评价样式。因此,本书在总结归纳评价的要素体系的基础之上,根据评价要素的属性、特征,以及在评价过程中的表现形态,按照评价方法的量化特征及评价过程的主客观程度,按评价过程的保密性,根据评价主体之间关系,根据评价目的性,按照评价标准要求,按评价对象,按照评价所发生的时间阶段,按照评价结果的表现形式,对人文社会科学研究评价的样式进行了分类研究,从而健全了人文社会科学研究评价的分类体系。

2.3 构建运作体系,为推动人文社会科学研究评价活动的有效进行提供实务指导

人文社会科学研究评价活动的运作需要建立组织系统、制度规范系统、工具系统来推动。因此本书通过整合执行、参与评价活动的机构和个人等实体要素,建立了人文社会科学研究评价的组织系统;通过整合评价活动执行中的法律、法规、行业指导性规范、政策管理性文件等软件环境因素,建立了人文社会科学研究评价制度规范系统;通过整合评价活动执行中供评审专家、机构等使用的查新系统、文献计量分析系统、期刊分级系统、专家遴选数据库系统、数据记录系统、信用管理与反馈系统、评价软件系统、远程网络通讯评审系统等辅工具的硬件环境因素,建立了评价工具系统。

从而构建了以评价活动的有效执行为中心,围绕评价主体及其活动,尤其是评价方的活动而运行的运作体系,其研究结果为推动人文社会科学研究评价活动的有效进行提供了实务指导。

2.4 构建评价指标体系的规范性程序与方法,为人文社会科学研究评价提供参考性指标体系

本书至始至终十分强调在人文社会科学研究评价中要着重人文社会科学研究的质量和效益的评价,体现质量和效益是对构建评价指标体系的基本要求。在这一思想基础之上明确了构建参考性评价指标体系的思路和原则,构建评价指标体系的规范性程序与方法。并且单辟章节分别详细深入研究了人文社会科学研究成果、研究机构、研究项目的评价体系。从而,设计了一套符合科学发展观要求的、着重体现研究质量和效益的人文社会科学研究评价的参考性指标体系,对于实际评价工作有极强的指导意义。

2.5 反思现行学术评价体系的问题,提出改进思路

本书对我国现行学术评价体系存在的量化考核简单化;同行评审形式化;核心期刊与SCI被误用;学术功利化与浮躁化等问题进行了反思。指出产生这些问题的原因在于:学术成果效益的不确定性、数据来源与评价成本约束、指标打分法的缺陷等内部因素的影响;学术研究规范的缺乏、重人情关系的社会文化背景、学术行政化因素的干扰等环境因素的影响;日常考核与学术“评价”的混淆、把资源投入当成绩效指标、宏观与微观学术评价挂钩不当、对评价主体和评价目的认识不清等主观因素的影响等。针对这些问题提出:要用科学发展观指导学术评价;以人为本,尊重科学研究的客观规律;推广“代表作”评价制度;放宽评价周期,提倡延迟评议;注重评价指标的导向性;对学术评价与行政考核作正确区分;减少学术评价中的行政审批层次;正确认识评价主体和评价目的;合理选用定性与定量评价方法;发展独立的第三方评价机构;建立元评价机制与规范;构建专门的学术期刊等级评价方法;推行学术出版认证,加强论著审稿规范等对现行评价体系的改进有启发性的思路。

3 关于人文社会科学评价实践的创新与价值

3.1 重实证研究,为人文社会科学评价的实践提供范例

本书不仅对人文社会科学研究评价的理论与评价体系建构进行了创新性研究,同时也十分重视关于人文社会科学研究评价的理论与评价体系应用于实践的实证性研究。

通过h指数用于人文社会科学评价的实践探索,详细揭示了h指数应用中的各种问题;通过我国学术期刊国际影响力的计量分析与评价实践的介绍,指出了我国期刊工作者和相关管理部门应解决的现实问题,为中国期刊从数量型发展引导到质量型发展的健康轨道上,以及使中国学术期刊在国际学术交流过程中产生应有的作用和影响力提供了决策参考;我国人文社会科学机构评价的实证研究,并详细介绍了大学评价智能服务系统的开发与应用、人文社会科学发展与评价信息系统的开发和应用等。通过对中国社会科学院研究所评价、教育部人文社会科学重点研究基地评价、中国高校人文社会科学研究竞争力评价等实证研究的思路与基本原则、具体做法、评价结果及分析、改进与优化等方面的详细介绍,为进行人文社会科学机构评价活动提供了很好的示范。

3.2 构建人文社会科学发展与评价信息系统集成平台,使本书的研究落到了实处

本书基于Microsoft SQL Server数据库平台构建了一个综合性、大容量、稳定安全的人文社会科学发展与评价数据库,即人文社会科学发展与评价信息系统集成平台,它主要是基于数据挖掘的大学评价智能信息服务系统和人文社会科学发展与评价信息系统的集成。它把人文社会科学领域的所有信息通过专题仓库管理起来,大大提高了检索的效率,以满足关心本领域发展的人们的需要,并为分析与评价提供数据支撑。它对人文社会科学领域的学科、机构、项目等各方面信息进行组织、分析评价,以满足项目管理人员和领导管理决策的需要。它为项目申请人员提供浏览本学科领域已申请或批准的项目情况,进行项目,并提供从项目申请、立项、结题到鉴定全过程的自助管理服务。为人文社会科学的项目管理与申报、专题信息检索与查询、研究成果评价与发展提供了一个简单易用、安全稳定的平台,具有很强的实用性。它通过动态追加项目的全程信息,有利于形成一个发展的庞大体系,建立一个人文社会科学发展体系。它通过把人文社会科学发展与评价信息进行重组和整合,有利于对高校、科研机构人文社会科学的建设进行客观公平的评价,从而发现不足,促进人文社会科学创新能力的提高。因此,对于人文社会科学发展与评价有非常重要的意义,也使本书关于人文社会科学研究评价的理论与评价体系建构的研究落到了实处。

4 结语

本书构建了一个包括评价理论、评价体系和评价实践在内的、完整的人文社科评价理论体系,从评价理论、方法、实践三个方面涉及宏观、中观和微观三个层面,系统研究了人文社会科学评价问题。是国内第一部全面、系统地对人文社会科学评价的理论进行深入研究,并将相关研究成果用于评价实践的著作,可供管理类专业,如信息管理、情报学、科技管理、科技评估、公共管理、管理科学与工程、教育评价与管理等许多专业的高校师生以及各级管理和决策人员、科技工作者、社科工作者及广大科研人员阅读使用。可以相信本书的出版,必将对今后人文社会科学的评价实践的科学、公正、规范化发展发挥指导作用。

参考文献:

[1]邱均平等. 人文社会科学评价理论与实践[M].武汉:武汉大学出版社,2012.

[2]邱均平,文庭孝. 评价学:理论·方法·实践[M].北京:科学出版社,2010.

对行为科学理论的评价篇2

关键词教育测验教育测量教育评价

教育评估、教育评价是20世纪30年代在美国兴起,60年代兴盛于西方世界并传入我国。这些学科虽然在我国大力已有20余年,但

的进展不大,学科的成熟度不高,与我国广泛开展的教育评价活动很不适应.我国各省市都有院(中心),也成立了许多评估、评价机构,广泛展开了对教育测评估评价活动。而与此相应的教育测验、教育统计、教育测量、教育评估、教育评价理论很不成熟.尤其值得重视的是教育评价与教育研究和发展,以及对教育评价实践的指导.鉴于此,本文对与教育评价相关概念进行简述和辨析.

一.关于教育评价相关概念简述

教育测验:即为考试,它是对人的知识、技能和能力以及某些心理特征的测量。考试是教育评价的一种手段。考试是个系统,它由主考、

被考(考生)、试卷(试题的集合及其评分标准)、考分四要素组成。考试的过程就是主考组织编制试题,通过试题作用于被考,将正确答案、评分标准与被考的反应(答案)相比较,然后给出考分的过程。考试从宏观上可分为考试和教育考试两大类。教育考试又可分为校内考试和校外考试两类。按考试分数的解释与使用,可分为常模参照性考试和标准参照性考试。按考试对象分,有学业的成就考试、学术能力倾向测验(其目的在于测量考生的潜在能力、发展倾向,如能力倾向测量)、人格测验(如测量态度、兴趣、情绪、性格等).按测验人数分,有个别测验、团体测量.接测验方式分,有纸笔测验(用笔时试卷作答)和非纸笔测验(如口试、实验操作、表演等)。其它可分为难度测验、速度测验、性测验、诊断性测验以及大规模测验(其成绩的使用有权威性,要求严格,标准化程度高)、教师自编测验(即教师自编用于课堂教学的测验)等.[1]

教育统计(学):运用数理统计学的原理和研究教育现象中的数量关系的一门学科。它通过数据的和处理,准确地掌握教育

情况,为制定教育方针、政策提供依据,为开展教育科学研究,探索教育,制定教育方案,检查教育效率提供科学方法,也为教育管理和教育评价提供有效的工具.它分为两大类:一是描述统计学,研究简缩数据和描述这些数据,二是推断统计学,用数据进行统计检验,统计分析和非参数统计法作出决策。前者只是分析某一样本的特点,而后者则是通过抽取母体的一个样本,并以此样本为根据来分析母体的特点.它是在教育的研究中,描述样本,分析样本,分析样本与总体的关系,从而进行教育科学推论的一种原理和方法.其研究方法一般有:大量观察法、统计分组法、综合指标法、统计资料检验法、统计资料图示等。[2]

教育测量(学):研究如何测量学生的学业成绩、学习能力、兴趣爱好、思想品德以及教育效益等问题的一门教育学科。它运用各种测量

手段和数理统计方法等数学工具,根据教育目标或教学计划的要求,研究如何测量和评价教育效果,如何编制测量计划,各种类型试题的优缺点,衡量一个学业成绩测验好坏的数量指标,如何进行测验结果的统计分析,测验分数的解释和评价等.其主要包括:测量原理、项目分析、效度、信度、标准化测验、测验的设计和编制、测验的常模、测验的实施和评分、测验结果的解释等。[3]

教育评估:是一种有系统地去寻找并搜集资料,对评估对象作预测性、估计性的评判,以便协助教育决策者从若干种可行的策略中择一而

行的过程.在我国教育评估与教育评价不作严格区别,在实践中具体运用时,不同的范围和场合有不同的习惯用法.如高等教育中多用评估,在督导部门也称督导评估,而在普通教育领域多用教育评价不过两个概念是有一定区别的.评估有估价的含义,较为模糊粗略,而评价相对而言是较为精确的价值判断,评估多用于群体或单位的状态及效果的估价,而评价则既有对群体和单位的价值判断,也有对个人的判断.教育评估的一个重要目的就是为教育决策提供重要依据,国家教育管理部门要根据教育评估的结果,及时调整教育的决策。教育评估的结果对国家、对学校都是一份咨询材料,而不是行动纲领.[4]

教育评价(学):以教育为对象,研究各类教育目标与相应的教育现象之间的关系,并给予一定的价值判断的学科.它的研究范围可划分

为:宏观教育评价(研究教育思想评价和教育制度评价)和微观教育评价(研究学校教育系统内部各类教育思想和教育活动的评价,如学校办学思想、学校领导管理质量、教师教育和教学质量、学生德智体全面发展质量的评价等)。它的基本范畴是:教育评价的对象,教育评价的范围,教育评价的模式,教育质的规定性评价,教育量的规定性的评价,教育质和量变化的度的评价,教育评价的指标体系,教育评价的类型.其研究的基本原则有:客观性原则、理论联系实际原则、发展性原则和联系性原则.其种类包括目标评价、过程评价、条件评价、贡献评价等.[5]

教育评价(学):教育评论学是研究教育评论现象和教育评论活动规律的科学.或者说它是研究教育评论的、现状,教育评论现象的

本质联系,教育评论工作的性质、任务和作用,以及教育评论工作的原则、方法的科学.教育评论学是与教育理论、教育史并列的一门教育学科.要建立教育评论学的学科体系,必须解决两大难题,即建立教育评论学的范畴体系和概念体系,并给予科学的揭示和阐述,使这些概念和范畴形成一个有机整体.同时,还要运用这些概念、范畴及其所固有的内在联系,采取科学的方法论证教育评论活动中最普通、最一般的科学原理;从而揭示出整个教育评论活动及其形成和发展的基本规律。教育评论学的研究对象和任务,从根本上规定了教育评论学的学科性质和范畴.首先,教育评论活动是一种教育科研活动,它的直接结果是鉴别、评判教育文化的优劣,进而对教育界产生社会舆论导向作用;而教育文化本身及其所产生的依附于受教育者身心的精神产品,都属于意识形态范畴,可见教育评论家属于研究意识形态和揭示教育评论活动的本质规律,建立完整的教育评论学学科体系。所以,教育评论学也属于基础理论学科。再次,教育评论学的研究对象决定了教育评论学涉及整个教育领域,内涵十分丰富。也可从不同视角,针对不同范畴建立多部门、多层次的分支学科(如:教育理论评论学、教育史评论学、教育行政评论学、教育家评论学等),所以教育评论学又是一门综合性的学科[6]

二、关于教育评价相关概念与教育评价的关系

教育评价与教育测验的关系:教育测验是对人的知识、技能和能力以及其他某些心理特征的检测,是教育评价的一种手段,确切地说它是

教育评价获得评价信息的工具之一.教育评价获取信息的测验法就是来自于教育测验.

教育评价与教育统计的关系:教育统计是运用数理统计的原理和方法研究教育现象中的数量关系,通过数据的分析和处理确切地掌握教育

情况,也是教育评价的一种手段和工具。教育评价中获取信息的统计法就来自于教育统计。

教育评价与教育测量的关系:教育测量通过对学生知识的掌握、智能的发展、思想品德的变化、体质的状况以及教育活动的各个方面的测

定,为教育评价提供依据,是教育评价信息的主要来源.如果没有教育测量提供的资料,教育评价将成为无源之水,失去了作价值判断的依据,其科学性、准确性便无从谈起。另外,教育测量的结果只有通过教育评价才能获得实际意义,成为改进教育工作有价值的信息.[7]

教育评价与教育评估的关系:教育评价与教育评估是非常相近的两个概念,在许多场合是通用的。评价是精确的价值判断;而评估是估计

的、预测性的价值判断。在我国从政府的文件到学者的文章论著,以及教育实践都把评估与评价混用。我个人倾向于把教育评估的对象限定在以宏观、中观的复杂教育系统的战略性、预测性估价方面,对于微观的较简单的教育系统的过去和现存实态则作为教育评价的对象。

教育评价与教育评论的关系:教育评论是对教育文化的反思和展望,它的对象是以教育文化中的精神文化和制度文化为主的,以真善美作

为评论标准的观念活动。严格讲它与教育评价虽只一字之差,但它与教育评价分属于教育科学的不同领域,有着重大区别。比如,教育评价是一种管理活动,而教育评论则为观念活动;教育评价由评价机构按严密的程序实施,而教育评论则由教育评论家个人采用灵活多样的方式方法评述;教育评价有明确的指标体系并要求量化,而教育评论无需指标体系更不用量化,教育评价的对象是具体的可控的,而教育评论的对象是抽象的,不可控的;教育评价的结果多用于改进工作,而教育评论的结果则多用于改变观念;等等。这不是说教育评价与教育评论一点关系都没有,它们的关系表现在教育评价的结果可以成为教育评论的论据教育评论,而教育评论的结果可以作为教育思想观念影响教育评价所依据的教育价值观。

三、从价值论角度看与评价相关概念的区别

唯物主义的价值论认为,价值判断和事实判断是人们把握客观世界和两种不同方式。两者反映的对象、意义和参加的心理成份都有着质的

区别。事实判断是以客体的本质和为对象的,它探讨客体“是怎样的“、”是什么“,探讨事物的现象、本质和规律等实体属性,即以理性认识这种抽象思维形式反映客体的本质及其规律。而价值判断是以客体与主体需要的关系为对象,它探讨客体的价值属性,即客体的意义------对社会需要意味着什么,它以多种意识形式-----认识(价值与事实判断)、情感(对价值的态度体验)、意志(对价值的自觉保证)等诸种形式的综合来反映客体与主体需要的关系。

从前面的可以看出,教育评价对评价的对象不仅要借助教育测验、教育统计、教育测量进行量的测定和分析,而且要进行质的分析,

把所有考查绩效的材料和分析综合起来,在多大程度上达到了预期的目的作出价值判断。从这里可以看出,教青评价行为是建立在事实判断基础上的价值判断.教育评价中的事实判断在于诊断与鉴别教育的性状,价值判断则是对诊断鉴别而得的结果或结论,按其价值取向进行合乎目的的推断和判断;事实判断是价值判断的基础,价值判断是事实判断的目的性追求。而教育评论是依据一定的教育价值观和教育价值取向,对教育的一种价值判断。从教育测验到教育评论是一个由事实判断向价值判断的变化过程,我们不能说教育测验丝毫没有价值判断,如在测验什么不测验什么的上是有价值判断的;同样,我们也不能说教育评论就无点滴的事实判断,教育评论需要通过事实判断的真凭实据作论据。

四、对教育评价学及其学科群的建议

教育评价学经过几十年的已初步形成了学科体系,尽管概念、体系有待完善,但已为下一步的研究打下了坚实的基础。与此相应的考

试学(研究教育测验的学科)、教育统计学、教育测量学、教育评估学、教育评论学都已有相应的发展,形成了一个共生的教育评价学科群。21世纪,要使这个学科群得到良好的发展,我认为首先对各个学科的研究范围有个明确的划分,尤其是对教育评价学要有合理的定位,不要再把学、教育统计学、教育测量学的纳入自己的努力范围,要让它们以独立的学科更好地为教育评价学服务。另外,教育评价学还要把属于教育精神文化、制度文化类的抽象的,教育评价无力评价的范围还给教育评论学,让教育评论学更快地发展.同时,要把教育评估与教育评价的关系处理好,可将两者合二为一,形成统一的学科.其次,各学科要明确自己的研究对象,形成概念体系和学科体系,把一些已成熟的概念和约定俗成稳定下来,逐步形成相对稳定的学科知识和概念体系。第三,要处理好理论与实践的关系,加强理论研究,使其适应实践的要求,要积极实践经验并升华为新的理论,丰富和发展教育评价学学科体系.第四,要处理好引进与消化吸收的关系问题。无论是从国外引进的教育评价学理论,还是从教育界以外引人教育的评价理论都要结合我国的教育理论和教育实践,进行修正使其“本土化”和“教育化”。

综上所述,搞清教育评价相关概念的关系,对理清教育评价学科群内各学科的关系,促进该学科群的发展,为丰富和发展教育科学,加快

教育事业的发展有重大的理论和实践意义。

[1][5]见李冀主编·《教育管理辞典》(第二版)·海南出版社·1997年版·第216页、第167页

[2]参见曹延亭编著·《教育统计学基础》·辽宁人民出版社·1984年版·第2--5页

[3]见李冀主编·《教育管理辞典》(第二版)·海南出版社·1997年版·第216页

[4]参见许茂祖编著·《高等教育评估理论与》·铁道出版社·1997年版·第16--27页

[6]见刘尧著·《教育评价学》·中国文联出版社·2000年版·第7--23页

对行为科学理论的评价篇3

作者简介:梁玖(1964- ),男,汉,重庆人,东南大学艺术学博士,北京师范大学艺术学博士后科研流动站出站博士后,北京师范大学艺术与传媒学院美术史论系主任,教授,博士生导师,北京师范大学艺术学博士后科研流动站合作导师。研究方向:艺术学,美术学,设计艺术学,高等教育研究。)

摘 要:在中国当下科学发展观的语境里,要持续建设艺术学学科、要创新艺术学导向方式与新成长模式、要将艺术经验与理性互证和确立完备理论系统必须关注和研究艺术学评价。研究构建中国艺术学评价学理与模型是当务之急。艺术学是一门关于研究艺术学科整体学问的人文学科。艺术学评价是指人们珍视和判别与创造艺术学科意义的活动。艺术学评价模型是指人们依据艺术评估理论而建立的工具性框架或范式。艺术学评价模型搭建的理论是“诉求艺术意义发现评价理论”(指期望审视特定艺术意义呈现程度的概念)。艺术学评价的核心指标(一级指标)是:艺术公认性、学科学理、需求满足、实际消费、管理水平、艺术赞助、艺术学术、特殊行为。总之,本文主张建立研究评定中国艺术学的学科――中国艺术学评价学。

关键词:艺术学;艺术学评价;建模;指标;评价体系

中图分类号:J05文献标识码:A

开展对艺术学评价及其评价建模的研究,是艺术学学科建设深入和精确度发展的体现。中国的艺术学学科建设是到了由草创而至体系精细化建设的自觉时期。在艺术学学科体系精细化建设的诸多内容与环节中,艺术学的评价问题不可忽视。其中,艺术学的评价建模又是一个必须关注和研究的课题。本文将对艺术学评价的前提、评价艺术学的理由、艺术学评价指标与评价模型建构,以及建议研究构建“艺术学评价学”等主题予以专题讨论。

一、艺术学评价的前提

要想对艺术学进行评价,必须弄清楚展开对艺术学评价的前提。即首先要明白地认知和理解艺术学到底是怎样的一个存在事实或自在、艺术学的存在对人类意味着什么?在不清楚什么是艺术学之前,是不能开展对艺术学的评价工作的。不清楚艺术学为何物的所谓“艺术学评价”也是盲目的评价。

1、艺术学是一个新兴人文学科

艺术学是一门关于研究艺术学科整体学问的人文学科。从这个角度讲,艺术学就是从现代学科视点审视而获得的一种门类知识。即,艺术学是艺术学科的总称概念。简言之,艺术学=艺术学科。因此,没有必要将艺术学划分为“一级学科的艺术学”和“二级学科的艺术学”之复杂概念。事实上,现在人们一提到艺术学的“一级”、“二级”问题就有点头晕。实践证明,对艺术学进行“一级”、“二级”的称谓划分,结果是让人们既不易识别艺术学,又不易传播艺术学。因此,我主张学习“教育学”学科对其范畴内涵处理编码的办法。“在教育学学科体系里边,对教育学历来都是整体推进研究的,也就是研究教育这门整体的学问。”①从实际来看,“教育学”作为门类学科概念,并不影响人们对教育学科之形而上体系内容和形而下体系内容的研究与实践。也就是说:研究“教育哲学”、“教育原理”、“教育历史”、“教育社会学”、“教育法学”等内容的学问与行为,并不专门叫着“二级学科教育学”。而研究“课程论”、“教学论”或“实践教学”、“教育测量与评价”、“教育管理”、“课外活动”、“教育技术与实践”、“微格教学”、“化学教育学”、“数学教学论”、“幼儿教学法”等内容的学问与行为,也并不专门称为“特殊教育学”。一句话,艺术学就是一种门类学科概念――关于艺术的学科概念。

作为艺术总体的学科群名的“艺术学”,是界别性指称概念。此“艺术学”的意思是关于艺术的学科话题,而不是关于物理学或非艺术的话题。本文标题《艺术学及其评价建模指标》中的“艺术学”意,就是“学科群名”或门类名的含义。清楚认识到这一点,既有助于促进艺术整体学科的建设,又有利于展开对艺术整体学科的全面评价。

当然,如果一定要给艺术学给予形态或分类划分的话,可以将艺术学分为:理论艺术学和学科艺术学两大称谓概念和范畴。即,在艺术学范畴内从理论形态上去关注和研究诸如艺术哲学、艺术原理、艺术历史、艺术创作原理、艺术风格、艺术批评、艺术社会学、艺术心理学等内容,最多也只能将其概称为“理论艺术学”。而对美术、音乐、舞蹈、戏剧等艺术子门类形态的专题研究,可以用“学科艺术学”称之。总之,我们不宜将艺术学复杂化。随着对艺术学学科研究的深入和精细,艺术学的学科研究者应将艺术学的知识和知识系统更加清晰编码,方便人们对艺术学的识别和传播。正如有专家所主张的:“艺术学英译应该统一理解为非纯粹而属于‘艺术科学’的基础上采用artistics似乎更适合一门学科名称。” ②

2、艺术学的存在意味指向

艺术学已经是人类学科分类中既存的事实知识。我们现在的主要工作任务是要分析讨论:艺术学的存在给我们揭示出了哪些学理性结论?艺术学存在揭示出的系列学理结论或艺术学内在规定原则,是有效开展艺术学评价的重要基础条件。首先,艺术学独立学科存在是意味着艺术无独立户籍游走时代的结束。当下,是到了将艺术学还原为它应该有的学科地位――门类学科――的时候了。那种,还让艺术学寄居“文学”学科门下的历史应该结束了。如果现有05作为学科门类“文学”的代码不变,艺术学的学科门类代码应该逻辑地编码为04最为适宜。③因此,将现有的0504代码的所谓“一级学科”艺术学更正为“04”的学科门类名称,是最为急切的学科建设任务。这也是艺术学存在的首要内在规定任务。

事实上,作为门类学科的艺术学之评价与作为所谓一级学科存在的艺术学的评价,在观念上是有很大差别的。其次,艺术学的存在是意味着艺术有自在的和人为的明确边界。这就明确告诉人们对艺术文化应该有珍视与欣赏的心态。非艺术创造者不能轻视或轻率地否定那些自己没有见过或看不懂的艺术创造行为或艺术作品。同时,艺术创造者也不能没有度地把自己随意的非艺术行为说成是艺术行为而误导民众。作为独立的艺术学学科,它自有内在积淀的学科学理和学科认识高度,任何人面对它都是有学识难度而生一定的敬畏心。如此,才能摒弃那种人为贬低和看不起艺术学科的不良认识观念与行为。这样也才内在地说明,评价艺术不能仅仅是个体的主观情绪认识表达行为。

评价艺术是有难度的。评价艺术学学科,从根本上来说是一种特殊教养评价。没有艺术学识支撑的艺术评价,是非艺术评价。一句话,不论是艺术创造者,还是欣赏艺术者都要在艺术边界内活动,都要遵循艺术的学科规律。这样,人们才能易于把艺术与非艺术区别开来。再次,艺术学的独立存在是意味着艺术成长的成熟度提升。艺术成熟度的增长,揭示了艺术学科有了纵深完善成长的基础。这也就内在地规定了当下艺术学人的工作任务目标是:努力促进艺术学科的精确度生长。可以说,讨论构建艺术学的学科评价建模指标,就是思考促进艺术学成长的实在路径之一。最后,艺术学的独立存在是意味着一切艺术活动有了守候的学科依据。无论是艺术教育的开展、艺术市场的建设、艺术文化产业的发展,还是艺术创造评价与艺术边界的拓展都有了自己核心的学科依据。

总之,欲有效展开艺术学的评价工作,需要清楚地认知什么是艺术学、需要明确艺术学独立存在的内在结论规定内涵。这样才能确保对艺术学的评价是专业的评价、是有信度和效度的评价。

二、讨论艺术学评价的理由

评价的根本目的是人们为了追求和获得对特定事物的价值判断与价值创造。“艺术学评价”所要讨论的,也就是如何更好地认识艺术学存在的价值。艺术学应有功能发挥得如何不是轻易就能判断的。艺术学独立的根本理由是因为人类的需要。那么,艺术学独立后的情形怎样?艺术学满足人们特殊需求的程度如何?人们对艺术学需求目的与实现手段之间的关系如何?艺术学的价值表达如何?等等这些问题是需要测量和鉴定才能回答的。

从中国艺术学将近百年的发展历程看,中国艺术学的成长并不是一帆风顺的。有专家将中国艺术学成长历程划分为三个阶段:“中国早期艺术学”、“中国艺术学的停顿期”、“中国当代艺术学”。④仅就从20世纪80年代开始的“中国当代艺术学”而言,中国特色的艺术学学科是有了恢复性和质的发展。但是艺术学总体成长情况并不是十分乐观的。

著名艺术学家张道一教授在2007年就撰文讲:“现在十多年过去了,议论不少,艺术学的学位点也设立了很多,但整合研究的成果并不明显,就像‘拼盘’一样。” ⑤张道一教授明确地指出;“艺术学不是‘拼盘’。” ⑥2008年我在论及中国艺术学现状时认为:“说起中国艺术学的现状,一方面是太热闹。另一方面是太浮浅了。因此可以说,目前中国的艺术学是跌跌撞撞的、吵吵闹闹的、被人哄抢的、戏剧与悲剧同在的存在局面。” ⑦到了2009年,中国艺术学的状况又怎样呢?可见,我们需要时常对艺术学存在的正当性内涵予以判别。

当下中国的艺术学是到了将经验与理性互证和确立完备理论系统的时期,要实现艺术学学科建设的这样的目标,不能缺失艺术学的评价调控手段。具体说来,我们讨论艺术学评价的基本理由是:首先,艺术学成长所需的梦想与智慧来源于人们及时的价值选择、价值创造与价值判断行为。⑧人们大量的艺术创造实验是特定艺术梦想的揭示,不断研究总结出的艺术原理是艺术智慧的反映。人们所获得的诸多艺术梦想与艺术理性知识是需要鉴别和判断与确定的。因此,如果不研究和确立一套评价艺术学的评判学说和机制,将不利于艺术学的有效成长。

艺术评价不是简单地判别谁好谁差。艺术评价最重要的任务是在评价行为中创造和确立与肯定新的艺术价值。只有不断创造肯定和累积了艺术价值体系,艺术学才能更好地发挥它存在的不可替代作用。其次,校正当下对艺术学混乱的认识需要评价参与有效地工作。当下关注中国艺术学的人,可以说是良莠不齐的。关注者素养如此,那么对艺术学的认知、理解和建设的结果之差异就很大了。曾“有艺术学科的资深专家公开讲:仅就全国艺术学科办学的问题而言,就存在着严重的问题。概括起来:有三分之一的人知道什么是艺术学科,并在努力地办学;还有三分之一的人不知道艺术学科,但在学着办。然而,还有三分之一的人不知道艺术学科却在盲目地‘瞎办’。应该说,这不是非理性的说法。目前,同样有资深的艺术学家也讲:我真佩服有的人胆子大,把无知到处贩卖。其所做的名为艺术学的东西并不是艺术学。

的确,专家们提到的问题是目前中国艺术学发展较为普遍的问题。比如:有的出版了名为‘艺术学’的书,事实上只是关于艺术知识的书,或者说就是泛行的‘艺术概论’模式的内容,而不是具有艺术学学科高度和体系的书,有的艺术学硕士研究生既不能清楚地描述艺术学学科研究方向的内涵,最终的学位论文选题也离专业有距离,或者说是非专业性选题,甚至有的以艺术学名义出场的人是对艺术学知之不多的人。” ⑨要校正和解决当下人们对中国艺术学的诸多模糊或混乱认识的问题,需要大力开展艺术学评价的工作。尤其是中国艺术学现实成长和发展的突出问题的解决,更需要艺术评价的介入和有效地工作。再次,中国艺术学的现实定位与长远定位成长需要评价护航。即,寻求中国艺术学新的生长点与发展模式需要艺术评价。有艺术业内的人常以艺术没有标准答案为由,认为艺术就是纯粹感性与模糊性的学科,时常弃绝对艺术的理性思考。有艺术业外的人,主观地认为艺术就是人们情绪一时的简单宣泄的杂耍学科而时常将艺术贬低而缺乏必要的珍视和尊重心理。

然而,那种常认为自己是从事艺术技术的人,自然就不会或不能对艺术进行理论驾驭的观点是错误的。那种认为艺术创作是纯粹个人的事情,对艺术创作和艺术作品的评价是非客观的公说公有理婆说婆有理的情绪评价之认识也是错误的。那种认为艺术不是高级知识集成的学科之认识仍然是错误的认识。事实上,感性情感的直感认知方式,只是艺术的认识方式之一。艺术虽然没有标准答案,但艺术有作为艺术自在的基本学理。感知、理知和情知是艺术认知活动的基本方式与途径。没有理知的艺术活动是浮浅的行为。

艺术评价是充分调集人的理智因素工作的一种创造活动。艺术评价不仅需要客观,而且艺术评价还是一种教养评价。不掌握厚实艺术学理的评价只能是浮浅的认知行为。中国当下艺术学要寻求到新的学科生长点和学科发展模式,没有大量的评价理智活动是不行的。一句话,中国艺术学无论在何时的定位成长都需要艺术评价的有力护卫。据2009年4月的新闻报道:在我国“已经播出31年的《新闻联播》将首次建立完整的评价体系,接受来自上级领导、专家学者和普通受众等各方面的评价。”最后,作为正规的艺术学学科应该接受和经得起随时的检验评估。任何正规的学科都是需要经过多维度地检测、评估而成长的。艺术学也不例外,中国艺术学是需要在不断地科学评价中成长。所以,中国艺术学学科的建设不能缺失艺术评价这一重要的结构内涵因素。

三、艺术学的评价模型指标

在中国当下的科学发展观的语境里,艺术学的学科建设需要评价的参与。不仅如此,艺术评价本身就是艺术学学科建设的重要结构内容。以科学发展观审视的艺术学评价,不仅仅是行业的经验评价、不是专家的随意评价、不是领导的兴趣评价、不是从业者的情绪评价、不是外行的盲目评价,而是符合科学发展观思想的艺术意义发现评价。也就是说,艺术学学科的体系建设不是为了艺术学学科体系而建设体系,而是要为促生艺术文化生长茂盛而建设。因此,艺术学学科的评价不是为了评价而评价,而是为了发现和创造艺术的意义、促进社会文明的艺术化水平、促进人们生存和生活的水平。

1、什么是艺术学评价模型

认知艺术学评价模型的前提是首先要界定什么是艺术学评价?艺术学评价,即艺术学科评价,也就是对艺术学科的全面评定。因此,我们将艺术学评价界定为:人们珍视和判别与创造艺术学科意义的活动。对艺术学评价来说,对评价项目“喜欢”的评定是艺术学评价的一个范畴。其重在对艺术价值表达的评定。艺术学评价包含厘清值得“珍视”的艺术意义这一维度是不可忽视的。对评价项目“鉴定”的判别又是艺术学评价的另一个重要范畴。其重在艺术价值判断的评定。鉴别艺术价值和创造艺术价值,是艺术学评价不可忽视的重要指标内容。

我们必须认识到:艺术学评价是一种特殊教养评价。艺术学评价不仅仅是鉴定被评价艺术项目或对象的好与坏、优与劣状况。而是要建立涉及珍视艺术、分享艺术、创造艺术的一系列评估概念与方法。也就是建立一套有效评定艺术意义与非艺术意义的评价思想、理论、原则、方法。人类生存的出发点和归结点是意义化生存。⑩艺术学科也正是人们在追问生存目的过程中创造的一种文化。艺术评价就是为了帮助人们发现评判艺术的意义,从而肯定艺术价值和选择分享艺术文化,最终实现自己的意义化生存理想。美国教育哲学家约翰•杜威曾说过:人类“所有的行为举止,只要不是盲目地凭情感冲动行事或只是机械地例行公事的话,似乎都包含评价。评价问题与关于人类活动和人类关系的学科构造问题是如此紧密地联系在一起。如果把评价问题置于这样的背景中,我们就可以清楚地看到‘这个问题是一个重要的问题’。”B11艺术学评价的衡量标准有:任务标准、环节标准、成果标准。

建立艺术学评价模型,是艺术学评价方法的具体体现。所谓艺术学评价模型,是指依据艺术评估理论而建立的工具性框架或范式。比如:美国政府在2009年4月24日就“公布了其对19家美国大型银行进行评估所用的框架”。B12还比如:我国有研究产业经济动态分析与政策研究的专家,在研究政府行政政绩评价课题时构建的评价框架就有以下一些体系性元素内容:“一、考核基本理念与原则;二、考评主体体系;三、考评指标体系构造框架;四、考核主要方式;五、考核指标体系、权重及考核标准制定;六、考核指标合成方法;七、考核工作基本程序。”B13只不过,搭建艺术学评价模型不是一个简单的事情。

目前,我们还没有看到一个有效的艺术学评价模型。真正有效和完善的艺术学评价模型的建立,不是一时所能完成的。这里首先是揭示我国建立艺术学评价模型的重要性和理由,强调当下应该确立艺术学评价模型意识、探索艺术学评价模型的基本理论、初步厘定艺术学评价的核心指标。一句话,本文是功在说明创新艺术学导向方式与新成长模式需要关注和研究艺术学评价、强调研究构建中国艺术学评价模型的急迫性和评价初步学理的确定。

2、构建艺术学评价模型的关键因素

建立艺术学评价模型是一个复杂的系统工程。其中的核心和关键因素是:首先,预设艺术学评价理论。即研究确定艺术学评价的基本理论。基于对艺术以有形符号表达无形精神意义之特质的思考、基于对艺术的主观性艺术经验事实与客观性学科共性知识的思考、基于对艺术学评价普适性与特殊性标准审视的思考、基于对艺术学学科构成的圈层体系结构特点的思考、基于对评价是在经验上和价值上观察与审视的理之思考,我们将“诉求艺术意义发现评价”界定为艺术学评价的基本理论。诉求艺术意义发现评价理论,是指期望审视特定艺术意义呈现程度的概念。“艺术意义发现”包含分析判别和揭示艺术价值与艺术经验两大特殊范畴系统。在对艺术学理论形态范畴的评价项目中,对特定艺术价值的揭示和创造是重要的审视内容。在对艺术学技术形态范畴的评价项目中,对特定艺术经验的揭示和创造是重要的审视内容。值得注意的是:这种区别认识只是为了说明艺术价值与艺术经验在判别不同的艺术学范畴内容时会有所专向检测与评估差异度。

事实上,对艺术学整个系统评价的时候,是要关注艺术意义呈现的整体度。其次,确立搭建艺术学评价模型的基本原则。适宜性、有用性、评价目的与评价手段统一性、评价指标设置全面性、综合情感评价与理智评价是艺术学评价模型建立的基本原则。而如何贯切这五个基本原则促进艺术学评价模型的搭建,则是研究外化运用的首要任务。最后,搭建起可操作的艺术学评价模型。

从理论上讲,能够搭建起一个可操作的艺术学评价模型,就已经表明艺术学学科建设中一个重要研究成果的诞生。然而,在实践上这是很有难度的。在此呈现的是一个预设艺术学评价模型。之所以称为预设艺术学评价模型,是因为它还需要经过大量地实测验证。虽然,对艺术学学科诸多评价项目需要情绪评价或称为软评价而不需要或不能验证。但是,作为艺术学评价模型却是需要验证的、也必须是可验证的。艺术学评价模型构想:(1)确立评价依据;(2)预设与选择评价目的;(3)选择被评价项目或内容;(4)选择评价结果合成方法;(5)确定结果成效的扶持力度。

3、艺术学评价的指标

艺术学评价指标,是指判别艺术学科项目既定达到的目标。艺术学评价指标以性质来看,可分为显性指标与潜在指标两大类。艺术学评价指标以项目审视,则可分为目标指标(包括任务指标、资源指标、成果指标、环节指标、效果指标、代价指标)、学科共性指标、奖抑制指标(包含扶持指标、惩抑指标)。筛选和确立艺术学评价指标是一个复杂的、科学的工作。

艺术学评价指标是体系化的、多层性的形态。这里以艺术学评价项目的视点,重点提出艺术学评价的一级评价指标系统。筛选提出的依据,一是根据“诉求艺术意义发现评价理论”;二是依据艺术学科生长成效观念;三是依据政府职效(审视政府调控职能的规定和发挥。比如:政府的艺术评价目的如何?艺术评价观念如何?艺术评价手段如何?艺术扶持如何?)、艺术学科个性、艺术内部系统比较、任务目标、竞争力、成长比较的视点;四是依据现实状况;五是依据被评价时期的艺术文化的丰厚度、艺术文化创造成果数量与质量、艺术人才培养与聚集、社会文明的艺术化水平。总之,从综合调研来看,艺术学评价一级指标由八个项目元素构成:艺术公认性、学科学理、需求满足、实际消费、管理水平、艺术赞助、艺术学术、特殊行为。

学科公认性指标,是考察被评价项目的社会普遍认同性。比如:民众认同性指标就是其子目标之一,包括民众对艺术创造者队伍、艺术作品品级、艺术教育等的公认性。学科学理指标,是考察被评价项目在艺术理论上的贡献程度。学理贡献、学科依据是具体审视的元素指标。需求满足指标,是考察艺术满足艺术接受者需求程度。艺术创作者自身需求、大众的艺术需求、艺术交流水平是具体审视的元素指标。实际消费指标,是考察艺术文化品被民众消费的程度。艺术品储备、民众消费艺术途径、民众的艺术消费水平是具体审视的元素指标。管理水平指标,是考察特定组织(如政府、社会机构等)对艺术运动系统的调控水平。艺术管理制度、艺术管理策略、艺术管理环节、艺术管理实效是具体审视的元素指标。艺术赞助指标,是考察艺术的服务性帮助程度。艺术与国民形象、艺术与社区形象、艺术与国家形象是具体审视的元素指标。

比如:2009年4月27-30日在全国农业展览馆(北京)举办了题为“艺术北京国际艺术博览会”。其中,“艺术北京”一词便揭示了艺术对北京形象塑造的意义。换句话说,如今北京除了原有的一些艺术组织、机构和琉璃厂那样的艺术区外,现在的798艺术区、草场地艺术区、宋庄艺术区、酒厂艺术区、观音堂艺术大道等艺术载体都对北京整体形象的塑造发挥了积极的作用。艺术学术指标,是考察研究艺术和创造艺术的艺术成果水平。学科研究队伍、学科研究项目、学科研究贡献是具体审视的元素指标。特殊行为指标,是考察特定时期内之艺术特殊存在与特别贡献的事项。特殊观念、特殊作为、特殊人才是具体审视的元素指标。

艺术学评价是复杂的评估工作。为了对艺术学系统更全面和准确地评估,还需要在艺术学评价一级和二级评价指标的架构下,分别设置艺术学科门类评价指标,这又是一个庞大的工程。

四、应该构建艺术学评价学

鉴于中国艺术学到了由外在因素决定发展到了由自己内在决定发展的准成熟时期。因此,有必要着手建立中国的艺术学评价学。艺术学评价学是关于研究评定艺术学的学科。中国艺术学评价学,自然是研究评定中国艺术学的学科。艺术学评价的现实需求、艺术学评价学科结构、艺术学评价的理论认识(比如:艺术学评价的硬理论与软理论、艺术学评价的受限评价与独立评价等等)、艺术学评价的概念体系、艺术学评价思路、艺术学评价的测评体系、艺术学评价模式改变、艺术学评价的新模型建构、艺术学评价比较、艺术学评价交流、艺术学评价的评价、艺术学评价文化、艺术多中心地域论的实施等等,都是艺术学评价所要关注的结构专题。

如果有效地建立了艺术学评价学,艺术学的学科评价才有可能做到更科学、更准确、更完善。从而促进艺术学学科更好地生长,帮助民众更幸福地生存。

① 梁玖《艺术学到底是个什么样》,引自朱恒夫、聂圣哲主编《中华艺术论丛》(第8辑),同济大学出版社,2008年版,第274页。 ② 易存国《中国艺术学学科建设问题审思》,引自黄主编《艺术学研究》(第一卷),南京大学出版社,2007年版,第303页。 ③ 从学科性质和学科构成逻辑上看,文学是在艺术学目录树下的子学科。一句话,艺术学的代码要先于文学的排序,才符合学科学理。

④ 李立新《中国艺术学八十五年历程》,引自黄主编《艺术学研究》(第一卷),南京大学出版社,2007年版,第447页。

⑤ 张道一《艺术学不是“拼盘”》,引自黄主编《艺术学研究》(第一卷),南京大学出版社,2007年版,第17页。

⑥ 张道一《艺术学不是“拼盘”》,引自黄主编《艺术学研究》(第一卷),南京大学出版社,2007年版,第10页。

⑦ 梁玖《艺术学到底是个什么样》,引自朱恒夫、聂圣哲主编《中华艺术论丛》(第8辑),同济大学出版社,2008年版,271-272页。

⑧ 冯平在翻译杜威《Theory of Valuation》后的“译者序”中讲:“我们必须研究价值判断、价值选择和价值创造,这就是价值哲学能够有所作为和需要有所作为的事情。”[美]约翰•杜威著,冯平等译《评价理论》,上海译文出版社,2007年版。

⑨ 梁玖《艺术学到底是个什么样》,引自朱恒夫、聂圣哲主编《中华艺术论丛》(第8辑),同济大学出版社,2008年版,271-272页。

⑩ 意义化生存,指人们有价值地保存生命成长的存在方式。意义化生存体在四个基本方面:确立自己的生存道理;有生活情趣;要履行自己的人生职责;要创造一定的价值。

B11[美]约翰•杜威著,冯平、余则娜等译《评价理论》,上海译文出版社,2007年版,第5页。

B122渭伊文《美公布银行评估框架》,引自《环球时报》,2009年4月27日,第14版。

B132渭张宏志著《科学评价理论与务实操作指南》,中国社会科学出版社,2006年版,第56-58页。

Artistics and Its Evaluation Model Index

LIANG JIU

(College of Art and Communication, Beijing Normal University, Beijing 100875)

对行为科学理论的评价篇4

【关键词】 哲学社会科学 成果评价 评价方法

一、引言

哲学社会科学研究成果的评价是哲学社会科学科研管理的重要环节,是提高科研管理水平的重要手段。中共中央《关于进一步繁荣发展哲学社会科学的意见》的,标志着国家对哲学社会科学研究的高度重视。因此,对科研成果的评价也就显得越来越重要,相应的也对科研成果的评价提出了更高的要求。科研成果的评价方法大

致可分为两类:一类是定性评价方法,一类是定量评价方法。

二、定性评价方法

哲学社会科学不同于自然科学的诸多特点使得哲学社会科学研究成果评价比较复杂和相对困难,就学科性质来说,最传统的定性评价方法比较适合哲学社会科学。

1、专家评价方法。专家评价法是“一种由科学共同体来做出有关科学真理性评价的制度”。其实质就是针对某一个具体的学术领域,组织该学术领域学者与该学术领域相关的专家,按照一定的标准,对涉及该领域的研究成果进行评价的活动。

(1)专家评价方法在哲学社会科学研究成果评价中的应用。在哲学社会科学研究成果评价中,专家评价方法具有其他方法不可替代的主体地位。中国国家社科基金项目实行同行专家评审制,设立评审专家库,按学科划分为学科评审组,届时抽取一定量的成员参加会议评审,对同行评议专家实施信誉制管理。

(2)专家评价方法的优缺点。传统的专家评价方法有其独特的众多优点:首先,同一学术领域的专家比较了解自身学科的研究现状,能够客观地评价出成果的创新之处;其次,对于无相关文献可供参考的评价对象,可以充分发挥同领域专家的经验智慧开展评价工作,减少或避免了因资料缺乏而带来的局限性、片面性;最后,当评价指标难以量化时,专家评价就显示出了它独特的优越性。

但不可否认专家评价法也存在着自身局限性:首先,马太效应不可避免,专家的名望在增加参与专家评议的机会的同时,也引发由机会不均匀带来的评审不公;其次,专家评价法存在着严重的主观性,当研究成果与个人因素相冲突时就会出现较严重的观念偏差,带来评价结果不客观性;最后,专家评价的最终结果有较大分歧时一般是采用学术民主的方式,原则上是少数服从多数,而这与具有创新性的科学活动的特点是不相符的。

2、公众评价方法。公众评价方法是对专家评价方法的补充,其自身的重要性也不容忽视。

(1)公众评价方法的内容。利用网络技术进行公众评价将是哲学社会科学研究果评价的一种必然趋势。可以借鉴自然科学研究成果评价的方法,由评审组织部门建立相关评价网站,对参评成果建立网上公众评价,或者设计科学的评价指标体系,以调查问卷的形式进行信息采集,然后将其收集到的资料进行归纳、整理,以作为定性分析的补充,同时用来弥补专家评价法的不足之处。

(2)公众评价的必要性。学术研究成果大多以学术论文的形式表现出来,学术论文是否具有创新性、价值性,读者是最有发言权的。科研工作者的科研成果并不是为了评价而发表的,是为了得到社会的承认,从而实现其社会价值。在哲学社会科学研究成果评价体系中增加公众评价的内容,可以促进学者们在理论研究上下狠功

夫,从而提升研究成果的理论价值和实践价值。

三、定量评价方法

定量评价方法的出现是为了避免定性评价法的主观性而产生的,其最大的优势就是具有客观性。

1、引文分析法。引文分析法是利用各种数学和统计学的方法进行比较、概括、抽象、归纳等的逻辑方法,对科学期刊、论文、著者等分析对象的引用和被引用现象进行分析,以揭示其数量特征和内在规律的一种信息计量的研究方法。目前引文分析法广泛运用于哲学社会科学研究成果的评价,以其客观性著称。

(1)引文分析法的分析指标。一般来说,对科学期刊进行分析时常用的分析指标有五种:自引率、被自引率、影响因子、引证率与即时指标。在对专业和学科结构进行研究时,除用引证率外,还可用引文耦合和同被引等分析指标。

(2)引文分析法的局限性。尽管引文分析法具有客观性强且易量化的优点,但也会受到一些因素的制约。第一,引文数量随机性导致平等“量”化困难。在实际的论文撰写时,作者所列出的引文在数量上是完全随机的,没有任何比例或限制。另外,引文数量会受其它客观因素的影响,例如外语水平、引文来源等等。第二,受时空的限制新发表的论文的被引率较低,刊物的发行范围也对被引率有较大影响。还有一些观点有明显错误的论文,被他人作为批评的对象而列入参考文献之中,这样的被引用也将影响引文分析数据的准确性。第三,参考文献不够规范,引文著录不规范会对引文分析产生不良的影响。

尽管引文分析法具有一定的局限性,但它毕竟是客观而科学的国际通用的文献计量评价方法,其客观反馈性和定量分析弥补了人为定性评价的缺陷,成为众多评价研究成果的多种方法中极为重要的评价方法。

2、文摘法。文摘法在某种程度上讲也是一种专家评价法,也被认为是“优选”。在理论上,文摘被认为可以作为“一种对论文的科学水平进行间接评价的手段”,文摘法在期刊评价中被广泛运用和认可,使得很多学术期刊不得不采取迎合文摘刊物的“文摘战略”。作为评价工具,文摘法的操作性很强,同时权威文摘刊物的评价效力也是为学术界所广泛认可的。

(1)文摘法所采用的主要摘录方式。文摘标识是以哲学社会科学领域著名的、带有权威性的转录刊物、文摘或者题录刊物收录情况作为衡量哲学社会科学研究成果价值和质量的重要标识。一般摘录的方式有全文转载、全文摘载、内容摘要和文献题录四种。

全文转载就是从众多哲学社会科学论文中挑选出一些质量高、学术价值大的重点论文,原文不作任何改动,集结成册出版发行,如中国人民大学的《复印报刊资料》和《中国跨世纪战略文献》等。全文摘载与全文转载性质差不多,在不改变原文的结构基础上,进行适当的压缩后出版发行,如《新华文摘》和《中国经济文库》等。内容摘要即是提炼出文章包含的一些新观点、新理论或者新方法,汇集出版发行。在我国,刊登这类专业性文摘的刊物较多,收入《新华文摘》“论点摘编”中的文献就属于这种。题录就是对论文的外部特征进行描述和揭示,然后汇集出版,如中国人民大学的《复印报刊资料》中所附的文献题录。

(2)文摘法的局限性。文摘法是以通过专家推荐为基础的方法,因此难免会存在一些局限性,主要表现在以下一些方面:一是文摘评价具有瞬时性,推荐与否必须在短时间内决定,一旦形成,无法更改替换,更无法查缺补漏。在某种程度上可以说是一次性的评价,因此存在着很大的偶然性。二是有些潜在的新兴学科或者极其具有创造性的研究成果,在发表之初可能会乏人问津或知者甚少,进而失去被某些权威文摘期刊选中的机会。三是文摘对学术不端和学术腐败的抵抗力不强。由于文摘的摘编者是固定的机构和人员,而文摘对某些单位、期刊和个人又十分重要,因此就不可避免得会出现“关系文摘”和“人情文摘”。在这种情况下,文摘机构和个人若不能超脱利益和关系的桎梏,就难以做到按质摘发。

3、指标计量评价法。近年来,哲学社会科学研究成果的评价方法的发展趋势是多指标、多层次综合评估。从管理学的历史角度看,多指标代表着评估方法一种新发展,使评估结果更符合现实况。常用的方法有以下几种。

(1)层次分析法。层次分析法(AHP)是将与决策总是有关的元素分解成目标、准则、方案等一个个的层次,并在此基础之上进行定量和定性分析的决策方法。这种方法是在对复杂的决策问题的本质、影响因素及其内在关系等进行深入分析的基础上,利用较少的定量信息使决策的思维过程数学化,从而为多目标、多准则或无结构特性的复杂决策问题提供简便的决策方法,尤其适合于对决策结果难于直接准确计量的场合。在应用多准则多指标对科研成果进行综合评价时,层次分析法显示出比较明显的优越性。

(2)模糊综合评判法。模糊综合评判法是利用模糊矩阵对科研成果进行专家评议,通过模糊矩阵复合运算,定量地描绘出科研成果优劣的方法。这种方法适用于评价指标以定性指标为主的评价系统,同时需要同行专家对每个评价指标的内涵有较高认同度。若评价系统是以定量指标居多时,用此方法就失去了其特有的优势。

(3)灰色关联分析法。灰色关联分析方法是根据因素之间发展趋势的相似或相异程度,即“灰色关联度”,作为衡量因素间关联程度的一种方法。灰色系统理论提出了对各子系统进行灰色关联度分析的概念,力图透过一定的方法,去寻求系统中各子系统(或因素)之间的数值关系。因此,灰色关联度分析对于一个系统发展变化态势提供了量化的度量,因此,非常适合动态历程分析。而且这种方法对数据要求较低且计算量小,便于广泛应用。此分析方法目的在于揭示因素关系的强弱程度,其操作对象是因素的时间序列,最终的结果表现为以关联度对各比较序列排序,由各样本关联度排出优劣顺序。

四、结束语

对科研成果的评价有助于肯定科研人员的工作成果,激发科研人员的创新动力,是科研过程中不可或缺的重要环节。在科研成果评价的过程中,要注重哲学社会科学与自然科学学科的差异性,不能将自然科学领域内的评价办法生搬硬套到哲学社会科学中来,更要注重定性评价方法与定量评价方法相结合,各取所长,综合考量,这样才能获得公正客观的评价结果。

(注:本文系陕西省教育厅专项科研计划项目“哲学社会科学研究成果评价体系研究”论文,项目编号08JK148。)

【参考文献】

[1] 黄顺基、刘大椿:科学的哲学反思[M].北京:中国人民大学出版社,1987.

[2] 全国哲学社会科学规划办公室:国家社会科学基金项目管理办法[EB/OL].http://npopss-cn.省略/2002sj/newglbf.htm,2002.

[3] 张慧颖、张卫滨、张颖春:哲学社会科学学术成果评价方法的比较研究[J].理论与现代化,2007(1).

[4] 刘建辉:社会科学学术成果评价方法探析[J].湖南大学学报(社会科学版),2007(3).

[5] 邓毅:建立科学评价机制改进成果评奖办法[J].华南师范大学学报(社会科学版),2004(10).

[6] 胡明玲、王建涛:引文分析的局限性及其改进[J].图书馆,2000(6).

对行为科学理论的评价篇5

[关键词] 科学探究能力;评价;现状;展望

[中图分类号] G420 [文献标识码] A [文章编号] 1005-4634(2012)01-0005-04

“突出科学探究、重视培养学生的科学探究能力是当前国际科学教育改革的核心理念”[1]。自新课程倡导科学探究的教学理念以来,我国的广大教师积极开展科学探究教学活动以培养学生的科学探究能力,但在此过程中面临的一个紧迫问题就是该怎么评价学生的科学探究能力。为了解决这一难题,我国的科学教育研究者对科学探究能力的评价问题进行了积极的探索,产生了一些研究成果。但这些研究成果较为零散,还缺乏较系统的归纳和总结。为了全面了解我国目前科学探究能力评价研究的现状,发现存在的问题和不足,为今后的研究指明方向,笔者拟对近年来我国的科学探究能力评价研究作一个较全面的梳理和分析,并对今后的研究进行了展望。

近年来国内的科学探究能力评价研究主要集中于对国外各种科学探究能力评价模式的介绍和述评,但已有少数研究者开始了对科学探究能力评价方法的自主探索,另外还有少量相关的实证研究,下面分别进行阐述。

1 对国外各种科学探究能力评价模式的介 绍和述评

科学探究的教育理念发源于国外,其科学探究能力评价的成功经验值得引进和借鉴。国内研究者对国外各种科学探究能力评价模式的关注度比较高,尤其是关于美、英两国和三大国际著名的学业评价项目中的科学探究能力评价模式的介绍性文章非常多,主要有对英国的GCE、英国的APU、美国的PADI和国际三大学业评价项目中科学探究能力评价模式的介绍和述评,另外还有一些具体的评价案例介绍等。

1.1 对英国GCE物理课程考试中科学探究能力评 价模式的介绍

赵保刚教授对英国GCE物理课程考试中的科学探究能力评价模式进行了介绍和分析[2]。英国GCE物理课程考试中的科学探究能力评价采用了笔试和实验操作相结合的形式。笔试的题目是开放性的密切结合生活实际的情境性问题,主要考查学生的科学思维能力和理论联系实际的能力。实验操作考试又分两种:一种是在教学过程中进行的,它包括实验设计、实施、分析论证和得出结论、评估程序和证据,由教师评分,考试中心复核;另一种是由考试中心组织的统考,它又包括两部分,第一部分要求学生就一个给定的问题情境设计探究方案。第二部分要求学生根据问题中给出的具体要求进行实验探究,包括调整实验装置、测量、制作图表、评估与解释探究过程等。

1.2 对英国APU科学探究能力评价模式的述评

钟媚博士对英国的APU科学探究能力测评试题的命题模型和思路进行了述评[3]。APU采用纸笔测验和表现性评价相结合的评价模式,开发了一整套用于科学探究能力评价的量化评价工具和质性评价工具。APU的命题模型要同时考虑探究技能、探究内容、情境三个维度。

钟媚博士还提出了英国的APU科学探究能力评价模式对我国的两点启示:第一,综合表现性评价和纸笔测验的优势,使两者优势互补;第二,应借鉴APU关于探究技能、探究内容、情境三者相结合的评价理念,开境性试题。

1.3 对美国PADI科学探究能力评价模式的介绍

周仕东、王书伟等对美国的PADI科学探究能力评价模式产生的背景、核心要素、原则和结构等进行了介绍[4]。PADI是由美国的罗伯特密斯里教授开发的一种科学探究能力评价模式。PADI评价模式的三个核心要素是:与探究有关的知识、技能;关于证据的各种观察;任务的显著特征。PADI评价模式的核心原则就是灵活性原则,如“评价方案可以但不一定与科学探究标准相一致”等就是灵活性原则的体现。PADI评价方案的结构一般包括题目、概要、知识技能、可能的工作成果、显著特征等共20个要素。

1.4 对三种著名国际学业评价项目中科学探究能 力评价模式的介绍和分析

朱行健对三种著名的国际学业评价项目TIMSS、PISA和NAEP中的科学探究能力评价框架和评价标准进行了较详细的介绍,在此基础上对三种评价模式的特点进行了总结分析[5]。

这三种评价模式的特点有:(1)从评价目标看,都以相应的目标分类理论为基础;(2)从评价的方式看,TIMSS和PISA采用的是纸笔测验,而NAEP既有纸笔测验也有实验操作技能的考查;(3)从评价的指导思想看,三者都是通过创设问题情境,让学生在解决问题的过程中考查学生的科学探究能力。

1.5 其他的一些介绍或述评性文章

对国外科学探究能力评价模式的介绍或述评性文章还有罗国忠研究员的《第三次国际数学和科学研究的科学探究能力评价体系及其启示》[6]、《美国俄勒冈州的科学探究能力评价》[7]、《美国密苏里州的科学探究能力另类评价及其启示》[8]、《美国纽约州科学课程学生探究能力评价例析》[9]和杜秀芳教授的《国外评价学生科学探究能力的两种不同视角》[10]等。罗国忠研究员的这4篇文章分别介绍了第三次国际数学、科学学业评价项目(TIMSS)和美国这3个州的科学探究能力评价案例,具体包括对这些案例的评价目标、评价工具、评分标准、实施策略的介绍和分析等,也提出了一些对我国的启示和建议。而杜秀芳教授的这篇文章归纳了国外对科学探究能力评价的两种不同视角,一种视角是把科学探究能力看作过程技能的集合,另一种视角是把科学探究能力当作一种思维和推理能力。在这两种视角下采取的评价方式也不同。杜秀芳教授认为这两种视角都有失偏颇,正确的做法应当是将两者进行综合。

总之,国内研究者对国外科学探究能力评价模式的介绍性文章较多,这些文章对于国内的科学探究能力评价实践与研究具有很好的参考、借鉴意义。但也存在一些不足,如对国外科学探究能力评价模式的描述和介绍多,但进行深入分析与评价的较少,不太注重与我国科学探究能力评价具体实践的结合。

2 对科学探究能力评价方法的自主探索

评价方法是科学探究能力评价中的核心问题,它关注科学探究能力“怎么评价”的问题。国内目前关于这方面的原创性研究成果还比较少,但已有一些研究者进行了这方面的自主探索,具代表性的有温盛伟、邱宝兰的科学探究能力评价量规的设计研究和李雪梅、范春玲的“探究日志”评价方法的探索。

2.1 科学探究能力评价量规的设计

温盛伟、邱宝兰设计了一种基于科学探究七要素模型的科学探究能力评价量规[11]。该评价量规分别按照提出问题、猜想与假设、制定计划与设计实验、进行实验与收集数据、分析与论证、评估、交流与合作7个要素进行设计,每个要素的分值为4个等级。量规中对每一种能力要素的内涵进行了界定和量化,并对该量规的使用提出了一些原则性建议。

该评价量规的设计立足我国基础教育科学探究能力评价的实际,针对性强。但该评价量规还缺乏关于其科学性和有效性的实证研究,这些问题还有待于今后进一步地深入研究。

2.2 “探究日志”评价方法的探索

探究日志是学生对科学探究过程中的活动和思考的记录,其内容一般包括探究计划、探究过程中的活动、对探究过程的反思等。李雪梅和范春玲研究了运用“探究日志”评价学生科学探究能力的方法[12],详细探讨了“探究日志”的结构、评价过程及其注意事项,并按照新课标中提出的科学探究七要素设计了详细的评分标准。

“探究日志”是一种属于形成性评价的科学探究能力评价方法。它全面详细地记录了学生的探究过程及探究过程中的反思,有利于教师全面了解学生的探究过程,及时发现学生在探究过程中存在的问题,从而采取相应的教学策略。今后还有待于进一步研究的问题是关于“探究日志”评价的科学性和有效性的实证研究。

3 对科学探究能力评价的实证研究

国内目前关于科学探究能力评价的实证研究数量还非常少,但已有一些研究者在这方面做了开创性的工作,这些实证研究有罗国忠研究员关于各种科学探究能力评价方式的有效性或公平性研究和张军朋、许桂清关于教师对科学探究能力评价方式的认识、态度研究。

3.1 对三种科学探究能力评价方式的实证研究

纸笔测验、工作单和现场观察是国外评价学生科学探究能力的常用评价方式。罗国忠研究员对这三种评价方式进行了实证研究,这些实证研究涉及纸笔测验和工作单的有效性研究以及三种评价方式的公平性研究。

1)对纸笔测验有效性的研究。罗国忠研究员对纸笔测验在评价科学探究能力方面的有效性进行了实证研究[13]。他以178名初三学生为实验对象,把学生分为6个组,对他们先后分别实施工作单评价和纸笔测验。研究结果表明,纸笔测验在整体和各探究要素上都不能替代工作单。因为工作单一般认为能有效评价学生的科学探究能力,所以这表明纸笔测验不能有效评价学生的科学探究能力。

2)对三种工作单有效性的研究。工作单按照其结构性的强弱,可以分为开放性工作单、结构性工作单和引导性工作单三种。罗国忠研究员对这三种工作单的有效性进行了实证研究[14]。 他以60名初三学生为实验对象,把学生分成3个组,分别以开放性工作单、结构性工作单和引导性工作单评价他们的科学探究能力。研究结果表明,三种工作单在现场观察的可替代性方面,结构性工作单最强,引导性工作单最弱,开放性工作单居于二者之间。三种工作单都能代替现场观察。这表明三种工作单都能有效评价学生的科学探究能力。

3)对三种科学探究能力评价方式公平性的研究。罗国忠研究员对纸笔测验、工作单、现场观察这三种科学探究能力评价方式对不同学生群体(性别、认知风格、物理学业成绩)的公平性问题进行了实证研究[15]。

该研究以178名初三学生为实验对象,把学生按照性别、认知风格、物理学业成绩进行分组,然后对他们的科学探究分别实施三种评价方式。研究发现,不同性别、认知风格和物理学业水平的学生群体在三种评价方式中的表现不一致。这个研究结果表明任何一种评价方式都不是天然公平的。

以上这些实证研究结论对于我国的科学探究能力评价实践具有很好的指导和借鉴意义。我国现在的科学探究能力评价方式还非常单一,纸笔测验方式还占绝对主导地位。而根据这些实证研究结论,纸笔测验在评价科学探究能力方面的有效性是低下的,而单一的评价方式也存在着公平性方面的缺陷,这就启示今后的科学探究能力评价应改变评价方式单一的局面,在加大工作单评价比重的基础上综合运用多种评价方式,以提高科学探究能力评价的有效性和公平性。

3.2 关于教师对纸笔测验和工作单评价方式认识 的实证研究

为了了解教师对纸笔测验和工作单评价方式的认识及态度,张军朋、许桂清以广东省的203名高中物理教师为对象进行了问卷调查研究[16]。调查的结果表明,对于纸笔测验,5.4%的教师认为“能测出大部分的科学探究能力”,62.2%的教师认为“能测出一部分科学探究能力”,24.3%的教师认为“一般”,8.1%的教师认为“几乎不能测出科学探究能力”。对于工作单评价方式,“约半数的教师认为工作单评价方式能非常有效或比较有效地测出学生的科学探究能力,四分之一的教师认为其有效性一般,另有四分之一的教师认为其有效性不高或较差”。

以上调查研究结果表明,对于工作单和纸笔测验在评价科学探究能力中的有效性上,教师总体上还是偏向于工作单评价方式。这个结果与国际上科学探究能力评价的形势是相符合的。国际上工作单评价是科学探究能力评价的主流方式,因为它具有高效而又相对省时、成本低廉等优点。这个调查结果为今后在科学探究能力评价中推广工作单评价奠定了一个良好的基础。

4 启示及展望

4.1 加强科学探究能力评价的理论基础研究

科学探究能力评价的理论基础包括科学探究能力的内涵、构成要素和认知心理机制等,它们涉及教育学、心理学、科技哲学和系统论等多学科的交叉和综合。目前我国在这方面的研究还非常薄弱,研究成果很少。科学探究能力评价的理论基础是进行科学探究能力评价的前提,只有建立在坚实理论基础上的评价才可能是科学的和有效的。因此,今后应加强科学探究能力评价的理论基础研究。因为该领域具有多学科交叉的特点,因此在研究中要加强多学科的交叉和融合,而不应仅仅局限于某一门学科的狭窄视野。

4.2 加强科学探究能力评价的本土化研究

目前我国的科学探究能力评价研究基本上还处在对国外相关研究成果的引进和介绍阶段,而自主的原创性研究成果很少。国外的科学探究能力评价无论是实践还是理论研究方面都比较成熟,确实有许多成功经验值得借鉴。但不能仅仅停留于对国外已有评价经验或理论的引进和介绍,而更应该加强科学探究能力评价的本土化研究。一方面,要对国外的相关研究成果进行更深入的系统研究,如是否适合我国的国情、该怎样借鉴这些成果为我所用等。另一方面,对科学探究能力评价的研究不能拘泥于国外的研究视域,研究者也要立足于我国的实际,努力贡献自己关于科学探究能力评价的原创性研究成果。

4.3 研究方法上要进一步加强实证研究

科学探究能力评价是一个理论与实践联系非常紧密的领域,研究中提出的各种理论模型、评价模式和评价方法等都需要相关的实证研究来支撑,这样才能保证研究的科学性和有效性,也才能更好地发挥对实践的指导作用。在前面的分析中可以看出,目前我国关于科学探究能力评价的研究中理论思辨多,而相关的实证研究还比较少。因此,今后在研究方法上要进一步加强实证研究。研究者不要仅仅局限于“书斋式”研究,而要深入科学探究能力评价的一线,在实证的基础上提出各种理论模型、评价模式和评价方法等,而这些理论模型、评价模式和评价方法又需要在实证中得到进一步的完善和发展。

参考文献

[1]马宏佳.以科学探究为核心的科学教育教学策略研究[M].北京:高等教育出版社,2008:4.

[2]赵保刚.英国GCE物理课程科学探究能力评价的特点[J].课程教材教法,2005,25(9):93-96.

[3]钟媚.英国APU科学探究能力测评及其启示[J].外国中小学教育,2010,(11):38-42.

[4]周仕东,王书伟,郑长龙.美国PADI:学生科学探究能力评价模式初探[J].外国教育研究,2006,33(7):36-40.

[5]朱行健.国际教育评价中的科学探究能力测评简介及启示[J].课程教材教法,2007,27(2):89-91.

[6]罗国忠.第三次国际数学和科学研究的科学探究能力评价体系及其启示[J].物理教学探讨,2007,25(6):1-2.

[7]罗国忠.美国俄勒冈州的科学探究能力评价[J].上海教育科研,2009,(7):59-61.

[8]罗国忠.美国密苏里州的科学探究能力另类评价及其启示[J].外国中小学教育,2009,(4):33-36.

[9]罗国忠.美国纽约州科学课程学生探究能力评价例析[J].物理教学,2009,(4):64-66.

[10]杜秀芳.国外评价学生科学探究能力的两种不同视角[J].教育科学研究,2009,(4):73-75.

[11]温盛伟,邱宝兰.科学探究过程评价的实施策略[J].中国成人教育,2007,(11):39-40.

[12]李雪梅,范春玲.运用“探究日志”评价中学生的科学探究能力[J].物理教学探讨,2008,26(4):5-8.

[13]罗国忠.基于纸笔测验的科学探究能力评价的有效性研究[J].上海教育科研,2007,(10):51-54.

[14]罗国忠.科学探究能力的评价方法[J].教育科学,2007,23(3):7-10.

对行为科学理论的评价篇6

论文摘要:管理科学研究中的学术规范问题已受到广泛关注。明确管理科学学术规范体系构成与其分析框架是规范研究中的核心。通过与霍尔的系统工程方法论的类比,从逻辑、范式、类型三维视角建立管理科学学术规范体系与分析框架,从学术创新、学术编撰、学术评价角度阐明了管理学学术道德规范、学术过程规范、学术表达规范的基本内容、分析规范与特征。

0引言

近年来,学术规范与学术规范体系的建立已经受到整个学术界的关注。在对学术规范问题探讨过程中,建立整个学术规范体系、从更高的层面、从更广阔的领域正视学术规范问题在学术界已形成共识。然而,学术规范问题的界定必然涉及学术规范体系。国内史学研究领域似乎对学术规范的问题有较早的介人以及深人的研究。在2002年4月召开的“史学期刊发展研讨会”上,对学术规范体系作了如下陈述:“学术规范是一个多层次的体系,是一个立体的系统。它包括学术研究规范、学术道德规范、学术批评规范和学术写作的技术规范等四个方面。学术研究规范包括学术价值观取向、思维方式、指导思想、理论方法、选题指向等方面,是学术规范的最深层次;学术道德规范,包括尊重前人的研究成果,科学诚实的研究态度,将把握学术史的发展作为研究的基础和前提等;学术批评规范,是专门就如何开展学术批评所制定的行为准则;学术写作的技术规范,是简单的技术层面的东西,是科研成果表述方式的规范化。这是国内基于史学研究对学术规范探索的完整阐述。学术规范的研究也在此基础上得到进一步深化。《学术规范导论》《学术规范读本》等对学术规范的研究成果,以学术规范研究规范著作的问世以及《高等学校哲学社会科学研究学术规范》的颁布为标志,奠定了学术规范理论与实践研究的基础。

追溯管理科学的发展历史不难发现,管理学研究的先驱十分关注管理学的规范研究,已经深人地探索了管理学的范式问题,分析了管理科学规范性研究蕴涵着管理的科学性、逻辑性、结构化及信度、效度评价等内容。应该说,管理学的规范研究有着较好的范式与传统。但应该看到,由于种种原因,目前国内管理研究存在着令人担忧的“失范”现象,这些“失范”现象使管理学研究中需要思考管理学规范研究体系的重建问题。本文在目前学术规范研究成果集成的基础上,建立管理学规范研究的分析框架,阐明管理学规范研究的基本内容与方法,运用系统分析方法,通过逻辑、范式、类型三维视角建立管理科学学术规范体系与分析框架,从学术创新、学术编撰、学术评价角度阐明管理学学术道德规范、学术过程规范、学术表达规范的基本内容、分析规范的特征。本研究对于推进管理科学的规范研究、建立和完善规范研究体系有重要意义。

1管理学学术规范体系的基本分析框架

1.1管理学学术规范体系的系统工程方法论分析

1.1.1霍尔(a. d hall)系统工程方法论体系

美国系统工程专家霍尔(a. d hall )1969年所提出的系统工程方法论为大型工程分析与决策提供了统一的思想方法,在许多对象系统分析中有重要的参考价值。这一分析方法将研究对象描绘成展示系统工程各项工作内容的三维(时间维、逻辑维、知识维)结构图。霍尔三维结构集中体现了系统工程方法的综合化、最优化、程序化和标准化的特点。这一方法将系统工程整个活动过程分为前后紧密衔接的七个阶段和七个步骤,同时还考虑了为完成这些阶段和步骤所需要的各种专业知识和技能。这一系统工程的方法论框架也是解决其他类型的重要参考范式。

1.1.2基于霍尔(a.d hall)系统工程方法论体系的管理学学术规范体系

显然,比较霍尔的系统工程方法论体系,管理学学术规范体系与之有许多相近之处。基于霍尔的系统工程方法论体系,可以从研究维度、各维度的主要内容,研究问题的思想方法等不同方面对管理学术规范体系进行类比研究。以下是两种体系主要部分的类比,见表。

由表1的类比可知,管理学学科体系是一个由多元要素组成的具有层次性的系统。霍尔的系统工程方法论体系对于管理学学术规范体系在目标维、阶段维、步骤维、知识维方面有许多相似之处,其系统工程方法论体系是完全可以用于解决管理学科体系的规范性研究。

1.2管理科学学术规范体系的分析框架

一项完整的管理科学学术活动首先有众多学术活动主体的参与;其次,管理科学学术活动一定在一个特定的学术环境中;再者,管理科学学术活动必然有一个从学术活动起始到学术活动结束以及继续发挥作用的循环往复过程。涉及众多要素,由于这些要素各有不同的归属,在管理科学学术活动中扮演着不同的角色,比如一项管理科学学术活动,可以按照不同的特征将其要素分为不同的维度。

管理科学学术规范体系框架是多项完整的管理科学学术活动的概括和提炼。显然每一项管理科学学术活动都经历一个起始、发展、终结的过程,它是在一定的时间坐标中完成的,因而时间维度的存在是必然的。另一方面,这一管理科学学术活动具有学术共同体所共有的学科规范,即“范式”(paradigm)或“学科基质”(disciplinarymatrix ),在这些学科规范的基础上,各学科在长期管理科学学术活动中形成了一定的学术规范即一定学术系统中的逻辑范式。这是学术规范体系中的逻辑范式维。与时间维组成了一定的学术规范体系平面。我们知道,不同的学

科体系所形成的学术规范是有差异的,也就是说,按学科的不同形成学术规范体系的另一视界,即学术规范体系的知识维。从而我们看到管理科学学术规范体系的基本框架如图1。管理科学学术规范体系框架从三个相互独立的视角表征其规范体系,这些包括方法论逻辑、范式、类型。由于每一个视角表征整体学术规范体系都体现出某种局限性,只有从多维角度能够更全面表征学术规范体系。

一项管理科学学术活动首先是一个从活动起始、活动进展到活动过程完成几个主要环节,从而体现出持续性、过程性,这是管理科学学术活动所具备的时间维度,这些管理科学学术活动体现一定的生命周期。因而这些过程包括问题阐述、研究假设与设计、文献收集与分析、结论与理论阐释。在这里,管理科学学术活动的规范体现为一定的结构性、一定范围内的程式,这种程式在一般管理科学学术活动范围内是必要的;另一方面,在管理科学学术活动的每一个阶段都要遵守一定的学术规范,这些包括学术研究道德、研究过程、研究表达三个主要内容,这是学术规范体系的逻辑维,体现学术规范的不同侧面,表明规范的全过程;显然,学术规范体系在不同的学科体系中有不同的内容框架。因此,学术规范体系有一重要的侧面即类型维。体现不同学术研究内容对其的影响。这些类型包括:学术创新、学术编撰与学术评价。因此,从三维视角我们可以清晰地了解科学研究规范的内容。

2管理科学学术规范体系的基本内容

从方法论逻辑维、范式维、学术类型维,可以更为清晰地了解管理科学学术规范体系的基本框架,在此基础上,进一步将其涉及内容细化,可得到学术规范体系的基本内容。以下对管理科学学术活动过程中类型维学术创新、学术编撰、学术评价三种类型分别进行分析,从而确立学术规范体系的一般内容。

2.1管理科学学术创新学术规范体系的基本内容

一般管理科学学术创新是指在管理科学学术共同体内的主要学术活动,是以人类知识宝库中增加新的知识元素为目标。其主要是在继承、消化既有管理知识体系和管理科学学术成果的基础上,运用管理学科专业的理论与方法,基于承继、结合、开拓的不同过程提出的新论点、新见解、新材料、新理论、新方法,从而达到丰富和深化人们对研究对象的演变规律及本质的认识。按照管理科学学术规范的体系框架,管理科学学术创新学术规范体系的基本内容如表2。

2.2管理科学学术编撰学术规范体系的基本内容

管理科学学术编撰学术规范体系的基本内容可以在以上阐述的基础上进一步拓展,如表3。管理科学学术编撰是指对已有管理学科领域现有成果进行鉴定、评价、综述或总结。其在管理科学学科发展与学术研究中起着展示学术动态、阐明管理科学学术研究趋向、确立本领域学术研究定位的作用。虽然管理科学的创新并没有使学术成果有明显增加,但对学术发展的意义不容忽视。随着当代科技的迅猛发展以及学术研究的系统化、规范化,目前,管理科学学术成果海量增加、管理科学学术研究的门类与学术形式全面拓展。因而,给学术研究领域的学术成果更新、不同学派观点的梳理、学术成果价值的评价提出了更高的要求。因此,需要对研究成果进行进一步的鉴定、评价、分类,分析其重要程度、应用价值、归属领域,并对研究成果进行梳理、做出评述,进而进行总结,作为新的知识体系,将更为便捷、更有指导意义提供给使用与研究者。比如多数工具书的编纂也属此类工作,编纂者在文献的梳理过程中,需要对现有全部相关成果进行鉴定和分类,并将它们概括并凝练为简明和完整的文字。显然,这种编撰的过程和结果是重要的学术过程,需要遵循规范的学术研究标准。按照道德规范、过程规范、内涵与表达规范及科学问题设定、设计与假设、文献、数据收集与分析、结论与理论阐述可以对管理科学学术编撰类型作深人的探析,见表3。

2.3管理科学学术评价学术规范体系的基本内容

管理科学学术评价是同行学者对评价对象是否符合一定学术标准及符合程度做出权威判断的学术活动。在当今社会不断重视科技创新及科技成果推广与应用的宏观环境下,管理科学学术评价正在经济社会中发挥着越来越重要的作用。从管理科学学术视角看,这一领域学术

评价具有界定性、权威性与导向性作用。目前,管理科学学术评价效应的主流是积极的。学术评价在学术活动中发挥着鼓励学术创新、引领学术发展方向、规范和控制学术行为、引导学术研究资源分配的作用;另一方面,由于学术评价“失范”现象,学术评价过程中的负面效应也是明显的,在大量的学术评价过程中,出现了学术资源的不合理与不公正分配,学术成果评价的失衡、失准,行政权力、不正当竞争介人学术资源分配过程,因而造成学术质量下降与学术资源的不合理分配,从而污染圣洁的学术殿堂、滋生学术腐败。可见,推进学术评价的规范化是极为重要的。

管理科学学术评价的主要要素与内容包括学术评价主体与客体、学术评价标准、学术评价过程、学术评价方法四个方面。

(1)管理科学学术评价的主体与客体。学术评价主体指学术评价过程的实施者,主要是针对评价客体所选择的具备一定评价能力与水平的评价者对评价对象进行直接或间接地评估,确定评价对象的综合能力及水平的价值判断。主要包括学术共同体、学术组织、个体学者等。学术评价的客体是指学术评价的主要对象,主要涉及国家与组织学术实力、学术规划与计划、学术项目、学术人员的学术水平、学术能力、学术成效的评价。

(2)管理科学学术评价标准。学术评价的基本原则是坚持客观、公正、公开性。对于从事管理科学学术活动的主体及学术成果评价应以学术价值或社会效益为基本标准,对基础研究成果的评价,应以学术积累和学术创新为主要尺度,对应用研究成果的评价,应注重其社会效益或经济效益。对于理论成果一般侧重于是否揭示了客观现象之间的相互关系,阐明研究成果所提供的对客观现象更准确、更符合实际的认知结论,表明这些对知识积累和知识创新是否发挥了积极作用。

(3)管理科学学术评价过程。学术评价过程是指学术评价活动中评价主体与评价实施组织按一定程序规范进行计划、组织与实施,达到评价过程的客观、公开与公正。

(4)管理科学学术评价方法。学术评价方法是指学术评价过程中每一个环节所应用的具体工具、方法。是评价主体为达到对评价对象的客观公正评价所采取的不同评价方式与评价定式。

按照学术规范的三维度范式表述,对于学术评价规范,在范式维与方法论逻辑维,其基本内容如表4。

3结论与讨论

对行为科学理论的评价篇7

 

当前,世界经济发展已步入知识经济时代,国际间的竞争关键是人才的竞争,研究生教育作为高等教育大众化阶段的精英教育,承担着培养高层次拔尖创新人才的任务,只有大力加强研究生教育、提高研究生培养质量,才能更好地为实施科教兴国、人才强国、创新驱动发展战略提供人才保障。

 

1 我国研究生教育评价现状

 

为适应经济社会发展的需要,我国研究生教育呈现出由扩大规模向提高质量转型,学位论文是研究生经过长期知识积累、理论总结和实验研究后的科研成果,它在一定程度上反映了培养单位研究生教育的质量监督及管理水平。为提高研究生培养的教育质量和国际竞争力,我国通过三级(部级-省级-校级)开展优秀学位论文评选工作,博士研究生有全国优秀博士学位论文的评选工作[1](简称“全国百篇”,该评选自1999年开始,至2013年以后不再开展),而对于硕士研究生,每个省每年都进行优秀硕士学位论文评选,在国家对研究生培养“质量主导”的影响下,各高校也高度重视优秀学位论文的培育和遴选。本文重点探讨优秀硕士学位论文的培育。

 

采取评选优秀学位论文这一举措,有利于推动研究生教育的改革和发展、提高研究生培养质量、促进高层次创新型人才脱颖而出,评优也逐渐成为各高校扩大自身影响力的重要平台。[2]不过,这一措施在具体实施过程中也引起了一些争议,主要表现在评价标准方面,现行优秀学位论文评选遵照的一系列评价标准往往主要来自官方条款,与具体学科和专业领域结合不够密切。另外,这些评价标准在具体操作中会受到评审专家个人主观因素的影响而产生偏移,这些主观因素可能包括对评价标准理解上的偏差导致执行尺度上的误差,还可能包括一些情感因素等。因此,建构科学合理的优秀学位论文评价标准,可以相对更客观、公正地评选出优秀学位论文,从而在真正意义上促进我国研究生教育质量的提升。

 

2 建构优秀学位论文评价标准的原则性建议

 

科学合理的评价标准是保证评价结果准确性的基础和前提。建构一套科学合理的优秀学位论文评价标准,使之评价指标内涵明确、测量标准尽量统一,兼顾不同学科专业和学位类型的差异性,最大可能消除名校名师“光环效应”和评审专家“主观片面”带来的误差,应遵循以下几项原则:

 

2.1 指导性原则

 

学位论文是硕士研究生学习阶段业务能力和科研水平的综合体现,优秀学位论文评价标准应引导高等学校在各自层次上不断提高教学质量和办学水平。《中华人民共和国学位条例》对硕士研究生的学术水平是这样规定的,[3]即在本门学科上掌握坚实的基础理论和系统的专门知识;具有从事科学研究工作或独立担负专门技术工作的能力,着重点是在打基础和进行能力训练,建构优秀学位论文评价标准可在此基础上提出更高要求,如优秀学位论文应有创新思维,提出新见解、新观点,进而推动研究生教育中对创新性的培养。

 

2.2 统一性和多样性相结合原则

 

统一性是指根据研究生教育培养目标而设计的体现学位论文共同要求的评价标准。多样性是指根据不同学科专业和不同学位类型的差异性而设计的不同的指标分类和特征描述。统一性与多样性相结合,建构优秀学位论文评价标准兼顾边缘学科与交叉学科,兼顾学术性学位与专业学位,精心设计各模块指标,使之既能够反映不同评估对象的实质,又可以相互兼容,从而保证评价标准的平衡性和完整性。

 

2.3 实事求是原则

 

评价指标应该符合实际、客观可信,才能较确切地反映出评估对象的真实水平。建构优秀学位论文评价标准应从评估目标出发,切忌从主观臆想出发,脱离具体实际。评价标准应忠实于评估目标,每个指标都能如实地反映客观的本质,同一层次的各条指标必须是相互独立,不重复、不矛盾。由此简化了指标,保证了评估的科学性,防止因评价指标过细,看似会提高评价精度,却给专家带来过多的麻烦,引起人为的偏差,反而会降低评价的准确性。

 

2.4 可操作性原则

 

制定评价标准必须简单易行才具有实际意义,离开了可操作性,无论怎样科学合理,都将失去存在的价值。建构优秀学位论文评价标准要把抽象的、复杂的不同专业、不同类型的学位论文细化为具体的、可操作的、量化的指标体系和评价要素,在“质”的规定上, 应确定关键指标, 剔除无关或相关度不大的指标, 形成简易可行的指标体系和评价要素。如学术性学位论文选题意义应突出理论创新、发展学科知识,而专业学位应注重理论知识的应用,选题应具有工程应用背景和应用价值。

 

2.5 定量评价和定性评价相结合原则

 

建构优秀学位论文评价标准应综合考虑各方面因素,尽量建立在可测量的基础上,对于能够量化的指标逐项量化,力求简约,在权重确定时要用数学等逻辑方式来验证,做到客观、公正、合理。而对于论文的创新性、写作能力与学风等指标不能完全用定量的方法进行评价,除了给出一个综合评分,还应加上一个综合评语,最后综合多位专家意见,使意见趋于一致。定量与定性有机结合,即防止因过度量化而割裂评价的本质,又防止因主观权力过大导致不公平。

 

优秀学位论文评价标准不是一成不变,而应该与时俱进,在实际运用过程中不断改进、不断完善。

 

3 优秀学位论文培育策略建议

 

建构优秀学位论文评价标准的过程同时也是对如何培育优秀学位论文进行深刻分析和认识的过程,优秀学位论文的培育工作可以从如下几方面展开:

 

3.1 把好选题关

 

俗话说,“好的开始是成功的一半”。确定好的选题是高质量学位论文产出的关键前提。确定选题之前应进行大量文献阅读,对所选课题领域的研究现状及前沿知识有较为全面的了解。导师和研究生应就论文选题是否为学科前沿,是否具有科学性、创新性,提出的技术方案是否可行,研究方向是否明确等方面进行详细、深入的论证。开题报告还应经过导师组严格论证,对于不适当的选题,一定要坚决给予否定,开题报告必须经过导师和学院主管领导签字同意后,才可以开始论文写作。由于论文写作周期比较长,经常会出现前松后紧现象,因此还须重视中期检查工作,及时发现研究生论文写作过程中存在的问题,对后期的研究提出指导性的意见。

 

3.2 实施培育工程

 

为了在全国优秀博士学位论文评选中取得突破,许多高校设立了优秀博士学位论文培育基金,[4]同样,我们也可以设立优秀硕士学位论文培育基金。优秀学位论文的培育是一项系统工程,培养单位应制定培育计划,设立优秀学位论文培育基金,从已经开题的研二学生中选拔优秀学位论文的种子选手,重点资助有创新性的科研项目,进行开展科学研究的初级训练。培育基金立项前,研究生管理部门对项目申请书进行严格的形式把关,导师组对项目研究内容和技术创新的新颖性、前沿性、可行性及对学科发展的意义等材料进行认真严格审查和答辩论证。培育基金立项后,加强过程管理,中期对项目进展随时检查, 发现问题, 及时解决,帮助研究生初步形成自己的科研计划。并进行严格的项目结题验收,对结题报告、研究成果的各项指标综合打分,评出优、良、中、差,将评估结果反馈给学院,与再申请直接挂钩, 建立奖罚政策。

 

3.3 加强导师队伍建设

 

优秀学位论文评选是评学生,也是评导师。研究生论文是否优秀与导师的精心指导是分不开的。导师的学术水平、科研水平、治学态度甚至为人处世的方式都对其所指导的研究生影响深远。创新型的人才须由具有创新意识的导师来培养,优秀的导师能够鼓励学生大胆探索,指引学生在科研活动中少走弯路,取得突破性的成果。加强导师队伍建设,首先,要建立健全严格的导师遴选制度,真正将学术水平高、指导能力强、具有创新能力、治学严谨的教师选拔成为导师。优秀的导师队伍是指导研究生写出优秀学位论文的关键。其次,加强考核,引入竞争机制,推行导师竞争上岗制度和流动原则,打破导师终身制,比如三年或五年内没有新的研究成果,不再担任导师,或者保留导师资格,但不分配研究生。最后,学校应定期召开研究生导师经验交流会,交流培养经验、共同探索、相互借鉴、以老带新,促进导师队伍建设。

 

3.4 加强科研条件建设

 

研究生培养单位优越的科研条件是优秀学位论文产出的重要保障因素。高水平的科研平台、丰富的图书资料、完善的硬件设施、充足的科研经费以及良好的学术环境等都属于非常重要的科研条件,此外,学科建设也是科研条件的一个重要方面,“学科建设在研究生教育中不仅是一种条件,更是一种环境。”[5]加强学科建设,推动学科发展走向学术前沿,有助于研究生学位论文做出具有一定学术水准的研究成果。

 

加强科研条件建设,首先,导师要多为研究生搭建科研平台,让研究生参与自己的课题研究,[6]加强科研实践训练,培养科研能力,为研究生做好学位论文夯实基本功。其次,加强图书馆和网络建设,及时更新学术资源,为研究生开展科学研究提供强有力的学术资源保障。努力完善实验室设施、设备,提供进行科学研究的基本物质条件。再次,科研经费的投入及其合理的配置是基本的科研条件,学校通过设立优秀学位论文专项培育基金,对每位入选者及其导师提供一定的经费支持,同时鼓励各学院提供配套经费支持。最后,注重开展学术交流活动,邀请国内外专家做学科前沿的报告,营造活跃的学术氛围,激发创新思维,助推研究生做出真正有创新思想的优秀学位论文。

对行为科学理论的评价篇8

学评价的计量化使评价活动强调了一些教学技巧上的细枝末节,却忽略了教师个人的才华,评价结果没能真正反映教师的教学能力和学识修养。教师教学行合理的评价关系到教师成长方向的确立。

对教师课堂教学进行评价首先要建立评价的标准,标准是评价的依据和前提条件。评价标准的建立使判断课堂教学效果的优劣成为可能,更重要的是,它能引导课堂教学的改革方向。同时,它还能引导教师个人的成长方向,即教师今后应把精力投向何处。因此,评价标准的建立对于评价本身是至关重要的。如果评价标准的“真理性”受到质疑,那么评价活动和评价结果的有效性就被打上了大大的问号。

评价的标准如此重要,那么怎样确立一个客观、合理的评价标准呢?或者说,评价标准确立的依据是什么呢?课堂教学的评价标准源于教学观。教学观是比教学评价更高一个层次上的范畴。教学观是人们对教学的一个总体的观点、态度和倾向。有怎样的教学观就相应地产生怎样的教学评价标准。

从更深层次上讲,评价本身还必须从哲学的高度进行探究。从教育史来看,教学观是随着历史发展的,一个时代有着这个时代特定的教学观,体现了这个时代的文化和精神氛围。

在机械论占统治地位的时代,人们建立的教学评价标准也相应地带上了机械论的色彩。机械论的教学观提出以学科知识点的掌握程度来建立评价标准,即根据学生是否达到了预先制定的教学目标来评价教师教学的优劣。在评价中主要关注教师的教学效果,以学生的学业成绩的“结果”作为评价依据,可把这样的评价体系归人“结果论”范畴。

随着西方社会对“机械论”哲学观的批判,人们在教育中越来越倾向人本主义教学观。人本主义教学观关注学生在教学过程中的成长。这种教学观并不认为学习的“结果”是重要的,而是认为学生对学习的“参与”这个“过程”本身最重要。说到底,在这个教育全球化的时代,在这个知识信息爆炸的时代,在这个“后现代”哲学登上舞台的时代,并没有什么固定的知识体系是学生必须去学的。密斯教授在他的著作《全球化与后现代教育学》中这样表述:“在教育界,全球化过程造成的普遍不确定性一直在某些方面存在。后现代派就‘什么东西可以信心十足地教给学生’这一问题所怀的担忧,如今更因‘信心十足地教意味着什么’这一难以理解的问题而加剧—尤其是在谓的新知识经济时代,教学往往被简单还原为如何‘管理’教育空间,除了计划和组织技巧外,不需要教师有任何个人才千。..}17随着西方哲学对“主体一客体”、“真理一谬误”这些二元思维方式的批判,西方后现代哲学流派更加倾向于对任何号称为“绝对真理”的体系进行“解构”。他们认为任何真理都是从某一“视角”出发来看待问题的,并不存在自在自为的绝对真理。后现代文化的氛围也渗透到了教育领域,人们从对真理的崇拜转向个人切身的体验世界,强调学生对教学过程的参与是第一重要的。在这种教学观下的教学评价体系主要关注教学的“过程”,强调师生互动,学生对教学的参与程度在评价体系中占有很大的比重,可把这样的评价体系归人“过程论”范畴。

中国的文化传统讲究“中庸之道”,对结果论和过程论的评价体系采取“取其精华,去其糟粕”的合理取舍的态度。这种中庸的态度也体现在了教学评价标准的建立上:评价的标准既要体现教学的目标是否达成,又要体现学生对课堂教学的参与程度。评价时既要参照预先规定的教学目标,又要关注课堂教学中“师生互动”的程度。

教育学属于人文科学范畴,教育科学并不像自然科学那样精确和量化。但是为了体现教学评价的客观和准确,又必须对评价活动给出一个“结论”。(评价结论该“如何”给出呢?是采用“计量化”的分值,还是根据教育学的人文科学性质对评价结论给予文本的描述?这本身就是一个关键的问题。)教学活动本身的不确定性与评价结果所要求的明确性这两者处于一种“张力”之中,如何合理把握这对矛盾(张力)需要极高的智慧。

由于整个现代社会竞争氛围浓烈,对教师的教学评价需要给出明确的评价结果以选拔“胜者”。由于对于精确计量化的自然科学取得的物质和技术成就的认可和崇拜,人文科学也慢慢开始以自然科学的客观性(以精确的计量化为特征)为标准。对计量化的喜好与崇拜甚至到了如此高的程度,以至于如果某一学科(例如教育学、心理学等)不能精确进行计量,不能最终得到一个“数据”,那么这些科学就显得“不客观”而配不上“科学”这一称号。人文科学的计量化趋势越演越烈,20世纪的西方哲学和人文科学对此深感忧虑,对这个趋势给予了强烈的批判。加拿大著名的教育学专家、教育哲学家范梅南在他的著作《生活体验研究—人文科学视野中的教育学》中对人文科学与自然科学的客观性标准作出了明确的区分,教育学应追求人文科学的严密性。“我们应该承认,人文科学对于准确、精确及严密有自己的标准。在定量科学中,准确与精确往往作为界定测量与设计精良的标志。与此相对,人文科学则尽量追求对具体事物丰富性与完整性的解释性描述,尽量使概念的基本本质达到完善。‘严密’的本意是‘坚硬’、‘硬度’。严密的科学研究基础被认为在方法上是严谨的、严格的,不与‘主观性’和定性研究妥协。‘硬数据’指最能反映数量单位或可测量到的测量的知识。与此相反,人文科学研究只有在道德和精神的意义上是‘强硬’的时候才是严密的。只有当一个人文科学的文本有勇气追求某些理念的独特性和意义时,才算是严密的。如果一个人并未准备坚持什么,那么坚持还有什么意义呢。这同样意味着,人文科学研究会以‘轻柔’、‘深清’、‘微妙’和‘敏感’的方式将生活现象的意义带人我们的意识。

人文科学的“计量化”趋势虽然遭到了西方哲学的强烈批判,但这个趋势本身似乎有进无退。为了追求精确和“便利”,“计量化”的方法也应用到教师教学的评价体系中。对教师的教学评价给出一些量化的指标:例如教学目标的确立是否合理,教师在教学中是否注重“师生互动”,教师的板书是否规范,教师是否采用了现代化的教学手段,等等。对每一项指标设立一个权重以赋予这些指标相应的分值,这些指标的分值相加以百分制计算。以这些量化的指标为依据来给每一位教师的教学进行评价。通过给每一项指标打分,并且根据统计学的权重计算对每一位教师的教学效果给出一个最终的“总分值”。评价标准的建立是如此重要,我们不禁要问:各项指标被赋予的权重“依据”是什么?进一步问:各项指标本身被确立的“依据”是什么?更进一步深究,用百分制的计量化方法进行教学评价的“依据”是什么?或许用分值进行教学评价比较“方便”,“方便”是真理的代名词吗?例如,甲教师最终得分80分,乙教师得分85分,从最终的得分来看,乙教师的教学水平“当然”要优于甲教师。当两位教师的教学评价通过两个分值摆在我们面前时,我们不禁要对这个评价结果本身进行评价。一个问题浮现在眼前:这样的评价是否合理?

虽然这样的教学评价考虑到了“结果论”,即教学是否达到了预先确立的教学目标,这样的教学评价也同时考虑了“过程论”,即教师在教学中是否注重“师生互动”等,但这些只是“外在的细枝末节”。通过这些关注细节的指标是否“真”能体现教师的教学水平?更令人担忧的是:对这些“外在的细枝末节”的关注恰恰忽略了教师真正的教学能力,恰恰忽略了教师内在的学识和师德修养,恰恰忽略了教师个人的才华。

如何评价教师真正的教学能力和学识水平呢?这些都是教师“内在的”个人素质,我们只能通过教师“外在的”教学行为来对教师真正的教学能力和学识水平“略知一二”。外显的教学行为与教师内在的教学能力和学识修养是怎样的关系呢?或许,德国哲学家西美尔对伦理学的深刻论述能给我们一些启发。西美尔认为外在的“伦理行为”并不是判断德行的最终依据。任何以命令式的“应然”规定的外在的伦理行为体系无法包容人类广泛的实践领域,无论是个人的实践领域还是社会的福乐安康。唯有“有德之人”才是一切良善行为最终的“源泉”。有德行的“人”在他的日常的一言一行中自然“流溢”出伦理的意义。作为一切外在行为载体的“人”为他的一切善与恶的行为最终负责。西美尔在他的演讲集《叔本华与尼采—一组演讲》中对此有如下论述:“古老道德所宣扬的思想是,德行看重的不是事实,而是事实背后的意志企图。这个思想在此处达到其完整的深度和广度:意志不再被视为具体的、受到某个特定理智推动的冲动,而是作为基本的存在,也就是人的那种不受任何时间与变化之决定的自在。与此相比,那种流行的、对道德责任的逆向追究,却让人觉得它仅仅是从看重外部行为的司法判定迈出的最初和暂时的一步。可是就凭这一步,人们却已首先到达了道德主义,也就是就日常实践而言已经足够的、那种针对个别行为意志的裁判机构;相反,此时在那条外部道路的狭隘的道德含义背后,人们才抵达了最后一站,那形而上的终点站;整个的人,也就是说,他的绝对的、不可更替的存在就是载体,就是每一个别的,仅仅作为现象的善与恶及其相应责任的真正现实。

人文科学的“计量化”趋势虽然遭到了西方哲学的强烈批判,但这个趋势本身似乎有进无退。为了追求精确和“便利”,“计量化”的方法也应用到教师教学的评价体系中。对教师的教学评价给出一些量化的指标:例如教学目标的确立是否合理,教师在教学中是否注重“师生互动”,教师的板书是否规范,教师是否采用了现代化的教学手段,等等。对每一项指标设立一个权重以赋予这些指标相应的分值,这些指标的分值相加以百分制计算。以这些量化的指标为依据来给每一位教师的教学进行评价。通过给每一项指标打分,并且根据统计学的权重计算对每一位教师的教学效果给出一个最终的“总分值”。评价标准的建立是如此重要,我们不禁要问:各项指标被赋予的权重“依据”是什么?进一步问:各项指标本身被确立的“依据”是什么?更进一步深究,用百分制的计量化方法进行教学评价的“依据”是什么?或许用分值进行教学评价比较“方便”,“方便”是真理的代名词吗?例如,甲教师最终得分80分,乙教师得分85分,从最终的得分来看,乙教师的教学水平“当然”要优于甲教师。当两位教师的教学评价通过两个分值摆在我们面前时,我们不禁要对这个评价结果本身进行评价。一个问题浮现在眼前:这样的评价是否合理?

虽然这样的教学评价考虑到了“结果论”,即教学是否达到了预先确立的教学目标,这样的教学评价也同时考虑了“过程论”,即教师在教学中是否注重“师生互动”等,但这些只是“外在的细枝末节”。通过这些关注细节的指标是否“真”能体现教师的教学水平?更令人担忧的是:对这些“外在的细枝末节”的关注恰恰忽略了教师真正的教学能力,恰恰忽略了教师内在的学识和师德修养,恰恰忽略了教师个人的才华。

如何评价教师真正的教学能力和学识水平呢?这些都是教师“内在的”个人素质,我们只能通过教师“外在的”教学行为来对教师真正的教学能力和学识水平“略知一二”。外显的教学行为与教师内在的教学能力和学识修养是怎样的关系呢?或许,德国哲学家西美尔对伦理学的深刻论述能给我们一些启发。西美尔认为外在的“伦理行为”并不是判断德行的最终依据。任何以命令式的“应然”规定的外在的伦理行为体系无法包容人类广泛的实践领域,无论是个人的实践领域还是社会的福乐安康。唯有“有德之人”才是一切良善行为最终的“源泉”。有德行的“人”在他的日常的一言一行中自然“流溢”出伦理的意义。作为一切外在行为载体的“人”为他的一切善与恶的行为最终负责。西美尔在他的演讲集《叔本华与尼采—一组演讲》中对此有如下论述:“古老道德所宣扬的思想是,德行看重的不是事实,而是事实背后的意志企图。这个思想在此处达到其完整的深度和广度:意志不再被视为具体的、受到某个特定理智推动的冲动,而是作为基本的存在,也就是人的那种不受任何时间与变化之决定的自在。与此相比,那种流行的、对道德责任的逆向追究,却让人觉得它仅仅是从看重外部行为的司法判定迈出的最初和暂时的一步。可是就凭这一步,人们却已首先到达了道德主义,也就是就日常实践而言已经足够的、那种针对个别行为意志的裁判机构;相反,此时在那条外部道路的狭隘的道德含义背后,人们才抵达了最后一站,那形而上的终点站;整个的人,也就是说,他的绝对的、不可更替的存在就是载体,就是每一个别的,仅仅作为现象的善与恶及其相应责任的真正现实。

外在的行为并不是伦理判断的最终依据,伦理判断的最终依据是形而上的整个的人,良善之人在他的外在的一言一行中体现出善的伦理意义。相类似的,“外在的”教学行为是教师“内在的”教学能力和学识修养的外显,优秀的教学真正的“源头”在于优秀的教师,优秀的教学活动是优秀教师的“整个的人”的自然流溢。对伦理行为的善恶判断困难重重,真正的教学评价也很难给出一个确切的标准。如果要对一位教师真正的教学水平给予恰如其分的评价的话,最终依据只能是这个作为教师的整个的人。或许能通过他的一堂授课(但决不仅仅依据这“一堂课”)去“体会”他的作为教师的个人才华。“才华”这个词同时包容了教师的学术水平、师德修养、授课的个人风格、语言艺术等。

对行为科学理论的评价篇9

研究的进展不大,学科的成熟度不高,与我国广泛开展的教育评价活动很不适应.我国各省市都有考试院(中心),也成立了许多评估、评价机构,广泛展开了对教育测评估评价活动。而与此相应的教育测验、教育统计、教育测量、教育评估、教育评价理论很不成熟.尤其值得重视的是教育评价与教育研究和发展,以及对教育评价实践的指导.鉴于此,本文对与教育评价相关概念进行简述和辨析.

一.关于教育评价相关概念简述

教育测验:即为考试,它是对人的知识、技能和能力以及某些心理特征的测量。考试是教育评价的一种手段。考试是个系统,它由主考、

被考(考生)、试卷(试题的集合及其评分标准)、考分四要素组成。考试的过程就是主考组织编制试题,通过试题作用于被考,将正确答案、评分标准与被考的反应(答案)相比较,然后给出考分的过程。考试从宏观上可分为社会考试和教育考试两大类。教育考试又可分为校内考试和校外考试两类。按考试分数的解释与使用,可分为常模参照性考试和标准参照性考试。按考试对象分,有学业的成就考试、学术能力倾向测验(其目的在于测量考生学习的潜在能力、发展倾向,如音乐能力倾向测量)、人格测验(如测量态度、兴趣、情绪、性格等).按测验人数分,有个别测验、团体测量.接测验方式分,有纸笔测验(用笔时试卷作答)和非纸笔测验(如口试、实验操作、表演等)。其它可分为难度测验、速度测验、总结性测验、诊断性测验以及大规模测验(其成绩的使用有权威性,要求严格,标准化程度高)、教师自编测验(即教师自编用于课堂教学的测验)等.[1]

教育统计(学):运用数理统计学的原理和方法研究教育现象中的数量关系的一门应用学科。它通过数据的分析和处理,准确地掌握教育

情况,为制定教育方针、政策提供科学依据,为开展教育科学研究,探索教育规律,制定教育方案,检查教育效率提供科学方法,也为教育管理和教育评价提供有效的工具.它分为两大类:一是描述统计学,研究简缩数据和描述这些数据,二是推断统计学,用数据进行统计检验,统计分析和非参数统计法作出决策。前者只是分析某一样本的特点,而后者则是通过抽取母体的一个样本,并以此样本为根据来分析母体的特点.它是在教育问题的研究中,描述样本,分析样本,分析样本与总体的关系,从而进行教育科学推论的一种原理和方法.其研究方法一般有:大量观察法、统计分组法、综合指标计算法、统计资料检验法、统计资料图示等。[2]

教育测量(学):研究如何测量学生的学业成绩、学习能力、兴趣爱好、思想品德以及教育效益等问题的一门教育学科。它运用各种测量

手段和数理统计方法等数学工具,根据教育目标或教学计划的要求,研究如何测量和评价教育效果,如何编制测量计划,各种类型试题的优缺点,衡量一个学业成绩测验好坏的数量指标,如何进行测验结果的统计分析,测验分数的解释和评价等.其主要内容包括:测量原理、项目分析、效度、信度、标准化测验、测验的设计和编制、测验的常模、测验的实施和评分、测验结果的解释等。[3]

教育评估:是一种有系统地去寻找并搜集资料,对评估对象作预测性、估计性的评判,以便协助教育决策者从若干种可行的策略中择一而

行的过程.在我国教育评估与教育评价不作严格区别,在实践中具体运用时,不同的范围和场合有不同的习惯用法.如高等教育中多用评估,在督导部门也称督导评估,而在普通教育领域多用教育评价不过两个概念是有一定区别的.评估有估价的含义,较为模糊粗略,而评价相对而言是较为精确的价值判断,评估多用于群体或单位的状态及效果的估价,而评价则既有对群体和单位的价值判断,也有对个人的判断.教育评估的一个重要目的就是为教育决策提供重要依据,国家教育管理部门要根据教育评估的结果,及时调整教育的决策。教育评估的结果对国家、对学校都是一份咨询材料,而不是行动纲领.[4]

教育评价(学):以教育为对象,研究各类教育目标与相应的教育现象之间的关系,并给予一定的价值判断的学科.它的研究范围可划分

为:宏观教育评价(研究教育思想评价和教育制度评价)和微观教育评价(研究学校教育系统内部各类教育思想和教育活动的评价,如学校办学思想、学校领导管理质量、教师教育和教学质量、学生德智体全面发展质量的评价等)。它的基本范畴是:教育评价的对象,教育评价的范围,教育评价的模式,教育质的规定性评价,教育量的规定性的评价,教育质和量变化的度的评价,教育评价的指标体系,教育评价的类型.其研究的基本原则有:客观性原则、理论联系实际原则、发展性原则和联系性原则.其种类包括目标评价、过程评价、条件评价、贡献评价等.[5]

教育评价(学):教育评论学是研究教育评论现象和教育评论活动规律的科学.或者说它是研究教育评论的历史、现状,教育评论现象的

本质联系,教育评论工作的性质、任务和作用,以及教育评论工作的原则、方法的科学.教育评论学是与教育理论、教育史并列的一门教育学科.要建立教育评论学的学科体系,必须解决两大难题,即建立教育评论学的范畴体系和概念体系,并给予科学的揭示和阐述,使这些概念和范畴形成一个有机整体.同时,还要运用这些概念、范畴及其所固有的内在联系,采取科学的方法论证教育评论活动中最普通、最一般的科学原理;从而揭示出整个教育评论活动及其形成和发展的基本规律。教育评论学的研究对象和任务,从根本上规定了教育评论学的学科性质和范畴.首先,教育评论活动是一种教育科研活动,它的直接结果是鉴别、评判教育文化的优劣,进而对教育界产生社会舆论导向作用;而教育文化本身及其所产生的依附于受教育者身心的精神产品,都属于馐缎翁冻耄杉逃缆奂沂粲谘芯恳馐缎翁徒沂窘逃缆刍疃谋局使媛桑⑼暾慕逃缆垩аЭ铺逑怠K裕逃缆垩б彩粲诨±砺垩Э啤T俅危逃缆垩У难芯慷韵缶龆私逃缆垩婕罢鼋逃煊颍诤址岣弧R部纱硬煌咏牵攵圆煌冻虢⒍嗖棵拧⒍嗖愦蔚姆种аЭ疲ㄈ纾航逃砺燮缆垩А⒔逃菲缆垩А⒔逃姓缆垩А⒔逃移缆垩У龋越逃缆垩в质且幻抛酆闲缘难Э芠6]

二、关于教育评价相关概念与教育评价的关系

教育评价与教育测验的关系:教育测验是对人的知识、技能和能力以及其他某些心理特征的检测,是教育评价的一种手段,确切地说它是

教育评价获得评价信息的工具之一.教育评价获取信息的测验法就是来自于教育测验.

教育评价与教育统计的关系:教育统计是运用数理统计的原理和方法研究教育现象中的数量关系,通过数据的分析和处理确切地掌握教育

情况,也是教育评价的一种手段和工具。教育评价中获取信息的统计法就来自于教育统计。

教育评价与教育测量的关系:教育测量通过对学生知识的掌握、智能的发展、思想品德的变化、体质的状况以及教育活动的各个方面的测

定,为教育评价提供依据,是教育评价信息的主要来源.如果没有教育测量提供的资料,教育评价将成为无源之水,失去了作价值判断的依据,其科学性、准确性便无从谈起。另外,教育测量的结果只有通过教育评价才能获得实际意义,成为改进教育工作有参考价值的信息.[7]

教育评价与教育评估的关系:教育评价与教育评估是非常相近的两个概念,在许多场合是通用的。评价是精确的价值判断;而评估是估计

的、预测性的价值判断。在我国从政府的文件到学者的文章论著,以及教育实践都把评估与评价混用。我个人倾向于把教育评估的对象限定在以宏观、中观的复杂教育系统的战略性、预测性估价方面,对于微观的较简单的教育系统的过去和现存实态则作为教育评价的对象。

教育评价与教育评论的关系:教育评论是对教育文化的反思和展望,它的对象是以教育文化中的精神文化和制度文化为主的,以真善美作

为评论标准的观念活动。严格讲它与教育评价虽只一字之差,但它与教育评价分属于教育科学的不同领域,有着重大区别。比如,教育评价是一种管理活动,而教育评论则为观念活动;教育评价由评价机构按严密的程序实施,而教育评论则由教育评论家个人采用灵活多样的方式方法评述;教育评价有明确的指标体系并要求量化,而教育评论无需指标体系更不用量化,教育评价的对象是具体的可控的,而教育评论的对象是抽象的,不可控的;教育评价的结果多用于改进工作,而教育评论的结果则多用于改变观念;等等。这不是说教育评价与教育评论一点关系都没有,它们的关系表现在教育评价的结果可以成为教育评论的论据影响教育评论,而教育评论的结果可以作为教育思想观念影响教育评价所依据的教育价值观。

三、从价值论角度看与教育评价相关概念的区别

唯物主义的价值论认为,价值判断和事实判断是人们把握客观世界和两种不同方式。两者反映的对象、意义和参加的心理成份都有着质的

区别。事实判断是以客体的本质和规律为对象的,它探讨客体“是怎样的“、”是什么“,探讨事物的现象、本质和规律等实体属性,即以理性认识这种抽象思维形式反映客体的本质及其规律。而价值判断是以客体与主体需要的关系为对象,它探讨客体的价值属性,即客体的社会意义------对社会需要意味着什么,它以多种意识形式-----认识(价值与事实判断)、情感(对价值的态度体验)、意志(对价值的自觉保证)等诸种形式的综合来反映客体与主体需要的关系。

对行为科学理论的评价篇10

    1 当前高校教师科研活动绩效评价有关研究综述

    2000年以来我国已形成了较稳定的教师科研绩效评价体系,这个阶段的一个显著特征是“数量化”,着重考察教师科研工作的内容与产出,运用数学方法确定相应权重,使得考核标准和考核结果能以数量化的形式得以体现。关于这个阶段教师考核评价的主要特点和存在的问题,正是对现行大学教师绩效评价制度所体现的主要特征的反映。

    1.1 评价流程基本一致

    在绩效评价的流程上,国内高校各不相同,但基本程序却有相似之处,主要经过以下几个阶段:首先是个人撰写年度述职报告(填表),然后上交职能部门或是上级领导进行考核,之后由高校考核小组审定并公示,最后反馈到个人。绩效评价方法主要采用定量方法、定性评议、排序方法、评分表、目标管理、关键事件法等方法。

    1.2 定量评价为主,亟待加强定性评价的理论及实践研究

    量化评价是与同行评议并存的两种主要的学术评价方法,量化评价广泛应用于我国教师科研业绩评价之中。对事物进行量化处理是人类社会生产生活必不可缺的手段和方法。学术量化评价起源于20世纪初逐渐发展起来的文献计量学,阿兰·普里查德(Pritchard.A.)被认为是“文献计量学”这一概念的正式创造者。文献计量学的兴起为学术量化评价提供了理论基础和具体的方法和工具。当今,世界各国广泛使用量化的方法来进行科学活动评价,如美国国家科学基金会每两年一次向国会提交的《科学与工程索引》,德国教育科研部每年发表的关于德国科学竞争力的年度报告,都是采用基于文献计量学的引文分析技术,来评价本国科学活动的竞争力。

    既然量化评价有其存在的科学性和合理性,那么为什么众多学者对其口诛笔伐呢?总结起来,我们认为争论的焦点主要在于:①重数量不重质量倾向,不利于我国科学研究水平的提高。如我国2006年SCI数量世界第9,但反映论文质量的重要尺度——单篇论文平均引文数只有3.01次,居世界第124位。②重短期不重长远。一个经常被讨论的话题是建国至今中国本土尚无诺奖获得者,过度量化的评价体系也被认为是原因之一。③重产出不重应用。④“一刀切”问题,将不同学科、不同研究类型的科研业绩统一按照研究经费等指标进行评价。在众多的研究观点中,分类评价的原则已经成为共识。

    可见,定量评价虽因其可操作性强、客观性强等特点而在我国大行其道,但也有其弊端和局限,在我国评价实践中,亟须采取必要的措施予以防范,众多学者将目光投向了定性评价。

    1.3 同行评议——定性评价的发展

    同行评议作为一种评价方法应用于学术领域要比定量评价早200年左右。1665年英国皇家学会创办了《哲学通报》,负责编辑工作的秘书亨利·奥尔登伯格从会员和其他科学通讯员那里收取报告他们科学新发现的信件,他天才地想起了将这些信件印发流通。随后英国皇家学会理事会决定,该学会理事会准许引发的小册子,应首先由理事会的某些成员做出评价。同行评议方法由此诞生,并逐渐发展成为一套应用广泛,要求严格的同行评价制度。

    由于美国等西方大学历来有学术自由的传统,同行评议被认为是学术共同体实现学术自治、学术自由的体现和保障,在西方大学中有比较一致的认可。例如,中国工程院外籍院士、哈佛大学教授何毓琦在给宋健院士的信中指出:“对质量的衡量是比较深奥的,需要专业知识和深入的理解。在学术工作中,质量恰恰是至高无上的。同行评审是一个被普遍接受和唯一可行的机制。然而,随着多元巨型大学的出现(大学规模越来越大),同行评价的效率和效果也受到质疑。

    民国时期,同行评议制度在我国出现,主要发挥了学术审查作用,民国初期的国立大学在判别被聘者学术水平高低与真伪上似乎没有一套健全和可行的制度,即使有同行专家审阅与推荐,也是出自个人之评语为多,缺少组织和团体鉴别。在大学之外成立的学术评审会等机构负责对教员的学术专著与论文进行审定,如1939年在重庆成立的教育部学术审议委员会就担负对学术进行审议和奖励的职责。虽然1986年成立的国家自然科学基金委是我国科学史上规模最大的同行评议实践,但由于其评价对象是研究项目,因此可以说,我国对于教师科研业绩的同行评价,从未大规模开展过。

    采用同行评价法评价教师科研业绩的流程大致如下:首先个人按要求准备科研业绩材料,并上交科研业务主管部门。科研业务主管部门进行审核,遴选符合一定条件的同行专家,并将材料送给同行专家。同行专家评价后收集评价意见,根据有关规则形成评价结果,将结果报送主管领导、校学术委员会等上级机构,做出最终决定。

    1.4 评价内容(指标)存在较大争议

    争议最大的是以SCI论文作为硬性科研业绩评价指标。上世纪80年代末,南京大学率先将SCI引入评价体系,自此以后,由于成本低、可操作性强等因素,SCI在我国不断得到推广,到上世纪90年代中后期,已经出现不少质疑的声音,2003年,科技部、中科院、国家自然基金委、教育部、中国工程院五部委联合发文,反对以数量来评价个人学术水平和贡献的做法。然而,SCI热并没有消退,反而愈演愈烈,与课题申请、职称晋升、科研业绩评价等均挂钩,甚至连发奖金都与SCI挂钩。客观的说,世界各国广泛将SCI用于科研绩效评价,但是在我国,SCI被滥用是不争的事实。2009年,“SCI之父”尤金·加菲尔德博士在接受《人民日报》记者专访时表示,SCI是一个国际标准数据库,单纯用这样的标准来衡量科研人员是不合适的,以SCI论文数量评价科学水平更是不合适的。评估人、包括评估一个机构或期刊,需要用多个科学评估标准而不是一个评估标准来评估。现如今,SCI被戏谑地称作“stupid Chinese ide a”,这的确是一个极大的讽刺,由于中国学者争先恐后地将自己的科研成果拿到国际上评审,且发表的SCI文章一年之后国人才能看到,一定程度上可以说,SCI导向制约了我国科研创新能力的进一步提高,因此应当参考SCI,制定适合我国国情的科研评价体系。

    用同一指标评价不同类型的科研活动,是属于同一问题的不同层面。不同类型的研究,其影响存在区别。比如,基础研究具有先导性、探索性、国际性等特点,基础类期刊读者层面更广泛,研究论文更容易受到人们的关注和引用,因此偏于科学的期刊其影响因子较高。收入于1994年度的SCI的期刊引用报告中影响因子大于20的13种期刊,绝大部分与生命科学有关。这只能理解为生命科学的研究是最受注意的一类研究内容。将不同学科、不同研究领域的科研业绩放在同一个评价指标体系中进行评价、比较,显然是不合适的。

    那么,如何解决不同学科不同领域的科研业绩共同评价的问题呢?这是一所大学内部科研业绩评价工作必须碰到和需要解决的问题。目前主要有两种思路,一种是分类评价的原则,即按照学校、学科类型(甚至教师个人情况,如年龄、职称等)进行划分,选取不同的评价指标,构建不同的指标体系,采取不同的评价方法来评价。另外一种思路则更进一步,即把分类评价的结果,通过数学方法转变为可以进行相互比较的量。这个可以相互比较的量一般是基于绩效理论的“投入产出比”。

    1.5 绩效评价——量化评价的进一步发展

    “绩效”是人力资源管理理论的重要概念,管理学对于绩效评价有广泛深入的研究,发展出了诸多评价方法,其中结合定量与定性的综合评价被认为是最成功的,也是未来的发展趋势。但是由于企业经理人更关心成本、利润等指标,而高校教师的科研业绩普遍采用“文章发表数量被引次数”、“科技奖励数量及层次”、“专利申请数量”等指标进行评价,因此,针对企业科技人员的评价系统并不能直接适用于高校教师。

    “投入产出比”是绩效评价的基本出发点,在企业“产出”被定义为利润,然而高校教师的科研活动很难定义为“产出”,因此我们看到有关高校教师科研绩效评价的研究中,“产出”基本还是指的是数量层次、专利申请及授权数量、获奖级别等传统量化指标,从这一点看,绩效评价仍然属于量化评价,由于相比传统量化评价,绩效评价运用了较为复杂的数理统计分析方法,因此绩效评价是量化评价的进一步发展。近年来的一些研究以绩效理论为基础构建了高校教师科研绩效评价模型,亦有研究考察了科研管理绩效对高校科研实力变化的影响。

    由于绩效评价仍然属于量化评价,所以即使采取绩效评价,我们还是能看到量化评价的弊端。举个例子,美国数学家纳什在1950年和1951年发表的两篇他一生中做出最大学术贡献的论文,奠定了博弈论的思想基础,并最终使其获得诺贝尔经济奖。但是,他的10年后才逐渐有人发现蕴含的深刻思想,如果按照“投入产出比”的观点来看,纳什对博弈论的研究只属于业余爱好,估计这项研究并没有争取到多少经费的支持,他的产出大概就是那两篇论文,他的科研业绩放在我国大学里,相信是不起眼的。

    2 新中国成立到2000年以前高校教师科研业绩评价的发展

    建国初期到“文革”前,是教师科研业绩评价工作的初步形成阶段。由于这一时期是我国高等教育体制的改造时期,我国的高等学校在各个方面包括教师考核工作,主要学习了前苏联的经验。1961年9月,中共中央印发《中华人民共和国教育部直属高等学校暂行工作条例(草案)》,第一次明确提出:“学校应该定期地对教师进行考核”,“高等学校教师的根本任务必须以教学为主”;“生产劳动,科学研究,社会活动的时间应该安排得当,以利教学”。由此看出,人才培养是这段时期我国高校的主要任务。《草案》的实施,首次为教师考核形成制度提供了政策保障,明确了教师职称的确定和提升要以考核为基础。这一时期的考核内容以教学工作为主,虽然提出的考核内容包括教师的学术水平,然而实际的评价依据基本是以教师的思想政治素质、教学工作量、生产劳动等内容为主。

    文革时期,是教师科研业绩评价工作的受挫瘫痪阶段。教育成为重灾区,我国各级各类高等学校的办学活动受到了严重影响,一批高校被撤销,部分高校教师被下放到基层、农村接受劳动改造,这对已渐有起色的科学研究形成沉重打击。在此期间,高校的各项正常工作次序被完全打乱,刚刚起步的科研业绩评价工作也完全处于停顿状态。

    从“文革”结束到20世纪90年代中期,是教师科研业绩评价工作的恢复改善阶段。除人才培养这一基本功能外,高等教育的科学研究功能被从国家层面予以确认,高校教师科研业绩评价工作随之得到发展,目前评价工作的许多做法,都可以追溯到这一时期,如在80年代中后期被引入到我国科技界的SCI,对我国科研业绩评价产生了广泛而深远的影响。

    纵观这一时期的教师科研业绩评价工作,主要有以下特点:一是考核方式由改革开放初的行政领导评价转变为注重教师具体科研业绩的量化,重点考察科研时机。二是打破了以往强调照顾教龄、论资排辈的做法,更注重择优晋升。这一时期,我国高校由原来以培养人才为主要任务,逐步转变为人才培养、科学研究、服务社会三大功能。与此同时,大学教师的职责由单纯的教学工作,到同时要从事学术研究和开展社会服务工作。所以这一时期评价工作的第三个特点是评价内容由原来以评价教学工作为主,转变为综合评价教师的教学科研等业绩。四是考核工作逐渐趋于制度化、评价结果普遍与教师职称晋升、薪酬等挂钩。

    应该说,这一时期科研业绩评价工作的种种举措有其独特的时代背景,一定程度上促进了我国高校科研事业的发展。然而在进入到21世纪以后,随着时代进步和相关评价研究的开展,我国科研评价体系如过度量化、评价手段单一等问题逐渐暴露出来,引发了科技界的广泛争议。

    3 结语