高考英语阅读文本复杂度研究

时间:2022-10-08 15:18:10

高考英语阅读文本复杂度研究

摘要:选取2016—2021年浙江省高考英语“一年两考”30篇阅读理解文本建立小型语料库,使用国外自然语言处理器Coh-Metrix对文本复杂度进行对比分析。结果表明:高考阅读选材广泛、体裁丰富,在文本长度、词汇难易度、二语易读性等方面较好地反映了《普通高等学校招生全国统一考试大纲》和《普通高中英语课程标准》的要求。对此,教师在英语阅读教学中应注重选材广泛,丰富学生阅读体验;注重提升学生阅读速度,培养学生快速获取信息的能力;加强阅读训练,夯实学生的语言基础,以有效提升英语教学质量。

关键词:英语高考;阅读理解;文本复杂度;Coh-Metrix

一、研究背景

《普通高中英语课程标准(2017年版)》(以下简称《课程标准》)指出,听、说、读、看、写是开展英语学习活动必备的语言能力。其中,阅读作为接收和理解信息的主要途径之一,不仅有助于学生获取大量有效信息,正确地认识世界和中国发展大势,学习国外的先进知识和技术,培养国际视野,而且能够在很大程度上提高学生其他语言运用技能。阅读理解作为各类大型考试中的重要组成部分,在考试内容和分值上都占据较高比例。阅读理解研究也一直是高考英语试题研究的热点。Coh-Metrix是由美国孟菲斯大学的亚瑟·格雷泽(ArthurC.Graesser)和丹妮尔·麦克纳马拉(DanielleS.McNamara)等人研发的一个基于网络的文本分析工具,其理论原理是影响阅读理解的多层面理论框架由词汇、句法、篇章格局、指称性情景模式、体裁和修辞结构、读者和写作者/说话人和听者之间的语用交际六个维度组成[1]。目前,国内主要使用Coh-Metrix测量指标研究对写作连贯性和二语写作产生影响的因素,极少数研究者使用Coh-Metrix分析考试中的阅读语篇。江进林、韩宝成使用Coh-Metrix工具,从8个维度分析大学英语六级、托福和雅思阅读语篇的易读性,通过单因素方差分析的方法,对三组阅读语篇难度进行比较[2];黄丽燕、王嘉樱使用Python和Coh-Metrix工具,比较浙江“一年两考”阅读理解文本的难度差异[3]。本研究选取浙江省“一年两考”(2016—2021年)的30篇高考英语阅读理解文本建立小型语料库,使用国外自然语言处理工具Coh-Metrix,从文本类型、文本长度、词汇难易度、二语易读性等多个维度出发,分析高考阅读文本的复杂度,为高考英语内容的效度验证提供实证数据。

二、研究设计与过程

(一)研究工具

Coh-Metrix是一种基于网络的文本分析工具,融合了计算语言学和语料库语言学等多种技术[4],本研究使用最新的Coh-Metrix3.0对阅读文本进行自动分析。Coh-Metrix3.0涵盖11个模块,可以自动处理15000词以内的单个文本;如果文本超过15000词,或者需要处理多个文本,其研发团队可以提供附加服务。

(二)语篇选择

本研究以2016—2021年浙江省高考英语“一年两考”阅读理解题第一节文本作为研究样本建立小型语料库,含10套试卷,每套试卷均包含3篇文本,共30篇文本。

(三)研究过程

在研究过程中,研究者将每篇文本保存为一个文档,并统一文本格式:高考阅读文本内超纲词汇加注汉语释义,使用分段符为段落标记,将标点符号统一为英文输入等。本研究以莱尔·巴克曼(LyleF.Bachman)和阿德里安·帕尔默(AdrianS.Palmer)提出的“任务特征”框架为依据,并参照《课程标准》的要求确立分析框架,分析框架的语篇输入包含文本类型、文本长度、词汇难易度、衔接、二语易读性五个维度。其中,文本类型包含记叙文、说明文、议论文、应用文;文本长度包含各语篇长度、语篇总长度、语篇平均长度;词汇难易度包含类符和形符的比例(TTR)、生词量;衔接包含指称衔接、潜语义分析、连词;二语易读性包含弗莱士易读性。

三、结果与讨论

(一)文本类型和文本长度

《课程标准》提出英语课程内容是发展学生学科核心素养的基础,包含6个要素:主题语境、文本类型、语言知识、文化知识、语言技能和学习策略。其中,文本类型是指记叙文、议论文、说明文、应用文等不同类型的文体,以及口头、书面等多模态形式的文本。2016—2021年浙江省30篇高考英语阅读涵盖《课程标准》中的三种文本类型,分别为说明文、记叙文和议论文。其中,说明文的选材在浙江省高考英语阅读文本中占比最高,约占50%;其次为记叙文,约占26.7%;而议论文所占比例最低,约占23.3%。2016—2021年浙江省高考英语阅读文本长度介于240~340个词,总体上符合阅读理解材料长度宜在200~500个词的要求。通过对数据的进一步分析发现:2016—2018年,文本长度较为平稳;但是从2019年起,文本长度的上升趋势比较明显。这一结论显示,随着时间的推移,高考英语阅读篇幅不断加长,对考生的词汇量和阅读速度提出了更高的要求。

(二)词汇难易度

词汇是语言的核心因素。本研究通过反映词汇密度的TTR和生词率来衡量文本词汇的难易度。一般来说,TTR值越高,用词多样性越强,语篇的词汇密度就越大,语篇的词汇难度也越大[5]。数据显示,2016—2018年浙江省高考英语阅读文本TTR平均值在逐年增加,文本词汇难度逐年提高,在2019—2021年,阅读文本TTR值趋于平稳,基本维持在0.57的词汇难度。整体来看,高考英语阅读文本中的生词量基本维持在1.5%~3%,符合《课程标准》中文章生词率不超过3%的规定。从单卷来看,2016—2020年阅读文本生词量上升趋势比较明显,并且存在部分阅读语篇生词率较高的现象,例如,2020年1月卷B篇生词率为3.92%,2020年6月卷A篇生词率为3.83%。较大的生词量会增加语篇难度,在一定程度上影响了考生考试成绩,但同时也能检验考生的词汇量,具有较好的区分度。

(三)衔接

衔接包含指称衔接(10个变量)、潜在语义分析(8个变量)和连词(7个变量)三个维度。指称衔接指句子间的实词重叠或指称相同(即共指),共指关系是一种能够帮助读者在观点、短语及句子之间建立对文本理解的语言学提示。许多研究表明,衔接在促进理解方面起着重要作用。当文本中一个句子的单词或概念与其他句子不重叠时,就会出现指称衔接的缺口。而指称衔接的缺口,会对不同阅读水平的读者在理解和阅读时间上造成不同程度的影响。潜在语义分析能够计算句子或段落之间的语义重叠,分析相邻句子或段落之间的语义相关性。连词对观点和短语之间建立衔接关系起着非常重要的作用,是衡量文本阅读难度的一大重要标准。从整体来看,2016—2018年浙江省高考英语阅读文本的衔接特征较为合理,历年高考阅读衔接性都处于平稳的水平。从单卷来看,2018年6月卷和2018年11月卷衔接性较低。衔接性在促进理解方面起着重要作用,较好的衔接方式有助于增强文本的连贯性,更好地帮助考生理解从句间关系、预测和推断情节发展,进而理解文本内涵。

(四)易读性

阅读难度指文本难以阅读和理解的程度,反过来讲就是可读性或易读性[6]。阅读测试所选用的阅读材料其易读性应适当,太难或太易都难以准确考查学生的实际阅读能力。本研究选择Coh-Metrix可读性模块中的弗莱士易读性数据来衡量阅读文本的难易度。弗莱士易读性指数范围为0~100,数值越高表明文本越容易。易读性值为50~60的文章材料属于“较难”的阅读难度,易读性值为60~70的文章材料属于“标准”的阅读难度,易读性值为70~80的文章材料属于“较易”的阅读难度,分别等同于美国高中生和7~9年级学生的水平。基于Coh-Metrix的文本难易程度分析,2016—2021年浙江省高考英语阅读难度整体上属于“标准”到“较难”的适当程度(平均值=63.6),具有一定的区分度,符合《普通高等学校招生全国统一考试大纲的说明》(以下简称《考试大纲》)要求。从单卷来看,大部分阅读文本易读性都在50~70的范围内浮动,也存在少部分在此范围以外的文本。比如,2017年6月卷C篇易读性为41.48%,2020年1月卷B篇易读性为36.62%。此类文本难度较大,对考生的阅读水平要求较高,考生阅读起来比较吃力;相反,2016年11月卷A篇易读性为86.68%,2017年11月卷A篇易读性为87.42%,此类文本难度较小,不利于有效考查和区分考生真实的阅读水平。

四、结论与建议

本研究以2016—2021年浙江省高考英语“一年两考”30篇阅读理解文本为研究样本建立小型语料库,通过Coh-Metrix工具,从文本类型、文本长度、词汇难易度、衔接和易读性五个维度定量分析高考阅读理解文本复杂度的总体特征。研究结果发现:高考阅读文本类型丰富,多采用说明文、记叙文和议论文类型的阅读材料;高考阅读在文本长度、生词率、文本衔接和易读性上都符合《考试大纲》要求,且文本难易度适中,基本能够反映高三学生阅读水平。鉴于上述分析结果,为提升高中英语教学质量,本文提出以下三点建议:

(一)掌握文本特征,重视体裁比较

浙江省高考英语阅读文本以说明文为主,同时涉及对记叙文和议论文的考查。掌握语篇的文本特征,可以帮助学生分析文章的层次结构、总结作者的写作风格,提升阅读理解能力。基于此,在教学过程中教师应结合具体阅读材料,有意识地引导学生归纳总结文本类型,探究同类文本在结构和语言方面的共性。具体来说,说明文重在说明事物,内容严密、语言准确,教师在讲解时要强调段落间的逻辑关联,培养学生语篇构建意识;记叙文以记叙、描写为主要方式,围绕文章线索展开,具有较强情节性,针对这类文本,教师可引导学生关注故事主线,抓住关键节点,预测故事后续发展;议论文由论点、论据、论证三要素构成,教师解读议论文时,可引导学生在“三要素建模”的基础上把握文本内容。

(二)增加词汇积累,关注语篇衔接

词汇是构成语言的最基本单位,词汇教学是英语阅读教学的基础[7]。因此,教师在课堂中要切实加强词汇教学,利用语块知识和构词法知识,不断扩充学生的词汇量。在扩大词汇量的同时,教师还要帮助学生加深对词汇深度知识的了解,如引导学生结合语境猜测词义。在这个过程中,学生不仅能加深已学单词词义的记忆,还能了解到该词在不同语篇中的不同意思。此外,教师还应加强对长难句的拆分和解读,在阅读分析过程中有意识地指导学生分析语篇的衔接和连贯方式,使学生可以根据衔接方式理解上下文之间的逻辑关系,进而从整体上掌握篇章结构。

(三)加强阅读训练,提高学生语言能力

《课程标准》指出,语言能力是英语学科素养的基础要素。对阅读文本的正确理解,要求学生具备扎实完备的知识基础。在英语阅读教学中,教师应切实加强词汇、语法、句法结构教学,夯实学生的语言能力基础。近年来,高考英语阅读文本长度不断增加,对学生英语阅读速度提出了更高的要求。因此,在培养学生精读能力的基础上,教师还应加强学生阅读速度的锻炼,重视学生快速获取信息的能力。在课堂教学之余,教师可以引导学生进行广泛阅读,给学生提供阅读不同题材文本的机会,增加学生的阅读量,通过大量阅读拓宽学生知识面,让学生熟悉不同题材语篇的解题思路和结构,提高阅读速度和理解能力。教师还可以引导学生进行限时阅读训练,加快对文章内容理解的速度,逐步达到阅读测试要求。

作者:徐莎莎 金颖 单位:浙江财经大学 外国语学院