职称英语考试的质量评定论文

时间:2022-10-13 10:18:00

职称英语考试的质量评定论文

[摘要]本文详细论述了专门用途英语测试、阅读测试以及效度、信度等测试质量标准的有关文献资料,在此理论基础上对职称英语考试的质量进行了分析评估,得出的结论是职称英语考试的效度比较低。因此,该测试手段质量不高、意义不大。该考试的设计者有必要采取一些有利措施提高测试的效度,但不可忽视信度,需要开发真实考试模式。真正测到想要测的能力,能从考试结果中了解和预测应试者在真实情境中的语言能力。

[关键词]技术人员职称英语等级考试;效度;专门用途英语测试;阅读测试

一、引言

自1978年以来,随着国际合作与交流的日益频繁,中国政府对英语的教与学给予了越来越多的关注。全国专业技术人员职称英语等级考试(以下简称职称英语考试)是由国家人事部于1999年开始组织实施的一项部级英语考试。专业技术人员必须通过该考试才能获得其专业技术职务的晋升。对这样一项与职称挂钩的全国范围内的英语考试进行质量调查和分析,不仅对专业技术人员个人及单位具有重要意义。对社会也将产生广泛的影响。

二、理论基础

现有的职称英语考试共分三个专业类别:综合类、理工类和卫生类,每个专业类别的考试各分A、B、c三个等级。该考试重点考查应试者的阅读理解能力。因此,本文首先需要详细论述专门用途英语测试、阅读测试以及效度、信度等测试质量标准的有关文献资料,在此理论基础上对职称英语考试进行效度研究。

2.1专门用途英语测试

与专门用途英语或专用英语(EnglishfDrSpecificPurposes:ESP)相对的是通用英语(EnglishforGeoeral;EGP),两者的区别纵乎在于目的不同——是“专用”还是“通用”。但事实上,用相对的概念来区分专用英语和通用英语必然会导致两者的界线不明。Hutchinson和waters(2002:53)明确指出,区分两者的不是目的的不同而是对目的的意识,也就是对学习者需求的意识(theawaremeasoftheneed)。其实,早在1980年Robinson就认为,对学习者需求的注意(attentiontotheneedsoftheleamer)肯定是。专用英语“定义中的一个关键要素。

这种对目的或需求的意识决定了专门用途英语测试考查的是应试者使用语言实现其专门目的的能力,即语言交际能力。很明显,应试者的需求不同,他(她)所应具备的交际能力也相应的不同,那么,专用英语测试的内容和方式也应有所不同——任何一次测试都应是为需求相同或基本相同的应试者专门设计的。测试的设计者的最初工作必须是对应试者的语言交际需求。或称目语真实使用情况(Targetlangungeuse)进行分祈和确定。然后测试内容(包括语域、语体、主题、语言技能等)、测试任务、评分标准的确定都应建立在需求分析的基础之上。测试的整个设计过程需要语言专家和专用英语使用领域的专家之间的密切合作。

2.2阅读测试

阅读是一个过程,例如,Hedge(2002)将阅读过程描述为一个有目的的(purpossful)、阅读材料与读者的背景知识相互作用的(intemctive)、读者对阅读材料作出评价的(critical)过程。阅读也可以被看作是这一过程的结果——理解,例如,Nuttall(2002)强调,阅读的关键在于理解——从阅读材料中获得意义(makesenseofthetext)。阅读是一个复杂的心理过程,对这个过程进行测试显然是非常困难的,而对其结果进行考查则容易得多(A1-deroen,2000:3—7)在考查阅读理解时,有两点值得注意:一是阅读是有目的的活动,测试者应考查读者为了达到阅读目的对阅读材料是否有充分的理解(adeqllaleunde—tanding);二是不同读者的背景知识会有差异,不同的知识系统与阅读材料相互作用以及不同读者作出自己评价的过程可能会产生不同的结果,测试者应认识到可能有一种以上的理懈是可以接受的。

在影响阅读测试的诸多因素中。有三个主要因素:阋读技能、阋读材料2.3测试质量标准B”hmaIl和Palmer(1999)从六个方面比较全面地阐述了如何评估测试质量,这六大质量标准是:信度(reliability)、效度(validity)、真实性(authenticity)、互动性(intersctiveness)、冲击(impact)、实用性(practicality)。其中,信度和效度是保证测试质量的两个主要的标准。

信度是考试分数的基本质量,如果测试成绩具有稳定性,那么这样的测试是有信度的。具体地说,同样的考试或平行卷考试对同样的应试者分两次进行,如果两次考试的分数接近,考试是有信度的,但如果两次的分数相差太大,考试就缺乏信度。效度强调的是考试分数在多大程度上反映了测试者的测试目的。也就是说,如果测试的内容与测试者想要测试的内容不一致时,这个考试的效度是低的,甚至是没有效度的。Bachman和Palmer(1999:23)认为,信度是效度的必要条件。但不是充分条件。因此,设计出对路的考试内容是关键,在此基础上应尽可能地提高测试信度。

三、分析与评价

基于以上所述,笔者认为,对职称英语考试进行效度研究实际上主要是具体分析考试内容是否反映了应试者的目的语真实使用情况。尤其是他们的阅读需求。信度是效度的必要条件。对它的评价也不可忽视。

3.1分析

笔者参照职称英语考试大纲,从近几年的试卷中具体了解到了考试内容和任务:职称英语考试中的不同专业的区分在于阅读材料的不同,不同的等级表示阅读材料的难度和阅读量的大小,而其它方面的设计是一样的。

3.1.1效度

职称英语考试重点考查应试者的阅读理解能力。这种不分专业、不分等级考查相同能力的做法本身就是有问题的。

下面笔者从三个方面来分析现行的阅读考试:

a.阅读技能

根据职称英语考试大纲。应试者应具备六种阅读技能。如果这反映了应试者的实际需求。那就意味着参加各级各类考试的人员在现实生活中所需求的阅读技能是完全一样的,很明显这是不可能的。

b.阅读材料

不同专业、不同等级的职称英语考试所选择的阅读材料是不同的,但是这些材料也不能完全反映出应试者平时使用英语的真实情况。笔者发现了以下凡个问题:

问题1.阅读材料在试卷上的呈现方式体现不出文章类型,如书籍、杂志、报纸、文件、信函或电子邮件等;

问题2.阅读材料中插有某些英语词汇的汉语解释;

问题3.职称英语考试要求应试者能够理解本专业或一般的英语书面材料,因此选择了一些主题与专业相关的文章,但是笔者细读内容之后发现,这些文章大多写的是科普知识,明显与应试者的真实阅读情境不符。

其实。这个问题的存在是不可避免的,因为考试只分三个专业类别,所选的阅读材料不可能太专业化。

c.阅读任务

职称英语考试有六个题型:词汇选项、阅读判断、概括大意与完成句子、阅读理解、补全短文和完形填空。而在现实生活中,应试者不大可能会碰到第一、第五、第六种阅读任务。

更为严重的问题是答题方式:应试者从头到尾只需选择就行。首先,这种测试方式不符合现实。而且选择题存在助“猜”的潜势,可能考查不出真正的阅读理解能力。

此外,各级各类的职称英语考试全是以60为及格分数,这个统一的分数线无法反映出不同行业中的不同等级的应试者在真实语言情境中完成蒯读任务时所需的不同程度。

3.1.2信度

因为笔者不可能对相同的应试者进行两次同样的职称英语考试或平行卷考试,所以这里对信度的分析中,笔者将重点放在评分标准上。职称英语考试中全部是客观题,这就决定了评分的客观性,整个评分过程丝毫不会受到阅卷者主观判断的影响,得出的分数应该具有相当的稳定性。

3.2评价

职称英语考试分类别、分等级,从表面上来看,设计者是考虑了应试者实际需求的,而且客观的评分过程也可能使考试有比较高的信度。但是,上面笔者所进行的还不够全面、不够深入的分析已经说明了该考试的效度比较低,因此,该测试手段质量不高、意义不大。

四、建议

职称英语考试的设计者有必要采取一些有力措施提高测试的效度,但同时也不可忽视信度。设计者要开发真实考试模式,真正测到想要测的能力。能从考试结果中了解和预测应试者在真实情境中的语言能力。显然。

对应试者的语言交际需求的分析是关键,这样的需求分析需要设计者、应试者、该领域的专家等的参与。

在这里,笔者就现行的阅读考试提出几点具体的建议:

a.设计者应尽可能充分建考虑应试者不同的阅读需求,这样的需求分析在每次考试之前都要进行,因为应试者的需求不是一成不变的。

在本文中。由于有限的水平和能力,笔者未能对阅读文章的难度进行分析。实际上,文章的难度是一个复杂的问题,mderson(2000:74)指出。在很多情况下,难度并不能够被绝对地确定下来,测试者可以从应试者的目的语使用情境中选择真实的阅读材料。

b.选取的阅读材料要真实,设计者不必在文中提供汉语解释,因为应试者可以使用词典。设计者可根据实际情况来确定考试时间的长短。

c.测试中的阅读任务要尽可能地真实。不过,要测试情境与真实情境相一致是相当困难的,对此,Robin(1980:79)通过引用波哥大研讨会(BogotaSemimr)报告中的内容提出,这种任务型语言测试的操作可以是非正式的——在真实生活中,让考查对象在不知情的情况下得到测试。

d.应试者应有机会表达个人的观点和态度。主观题的存在要求评分标准的制定要准确、细致,阅读考试的评分标准的制定应围绕所测的阅读能力,面非写作能力,笔者甚至认为。应试者也可用自己的母语来回答主观题。此外,对阅卷者的培训和监督一定要严格。当然,为了提高信度,客观题也许可以不要放完全排除。设计者可以采取措施阻止”猜“的行为,如选错答案比不选答案扣分要多。公务员之家

上文中提到过职称英语考试只分三个专业类别,有些闯题是不可避免的。笔者感觉到,如果划分的专业越多,考试的效度就可能越高。其实,一次真正意义上的专门用途英语测试只能是为一个应试者而设计的,因为每一个人的语言真实使用情境都是不尽相同的。

五、结束语

本文基于强有力的理论论述,对职称英语考试进行了效度研究。笔者发现,不同类别、不同等级的考试之问有太多的相同点,考试内容和任务不能很好地反映出应试者的实际需求,因此该考试的效度比较低,质量不高,亟待改进。本文中提出的一些建议只是理论上的,在实际操作中还有很多问题要解决。