即时通信基本概念十篇

时间:2023-10-11 17:25:16

即时通信基本概念

即时通信基本概念篇1

关键词:信息检索技术;基于关系;ir

一、引言

在众多的文本信息处理技术中,ir技术是最常用,也是大规模文献数据挖掘技术中的重要部分。随着社会发展,ir几乎涉及到了每一个人的每一天,如使用web搜索引擎或查找邮件。ir技术在巨大需求下迅猛发展,压倒传统的数据库搜索方式,成为占统治地位的信息获取途径。

二、基于语义的ir技术

随着科学技术和通信技术的发展,人们开始重视符号背后代表的语义信息。现实世界中每一个事物总存在着基于广泛共识的本质的区别于其它事物的特征和属性,即一个事物的概念,用概念代表事物而不是用符号,可以避免通信或科研中由多词同义和一词多义带来的歧义问题,有利于人们对事物达成统一的认识。事物、概念和符号的联系和区别。

概念一般是公认的准确全面的描述,却不易使用,如果给每个概念一个唯一的id标识,则会带来极大的方便。基于语义的ir技术使用umls, wordnet等本体库作为语义的基础和标准,在语义层面上理解和处理查询或文本。例如,在一次信息检索过程中,用户输入的查询是:计算机(符号),可知他的查询本意是查找名叫“计算机”或“电脑”(符号)的“用来计算的仪器,尤指可进行高速数学或逻辑运算或汇编、存储、整理或处理信息的可编程的电子机器”(概念)对应的相关文本。wwW.133229.cOm如果上述概念有一个公认的唯一的概念id: 1234(概念与概念的id的对应关系一般由本体库收录),则用户输入“计算机”作为初始查询时,系统确定对应的概念id,并应用这个唯一id进行检索。

三、改进的基于关系的ir技术

传统的ir用词汇项表示文本,后来改进为基于语义的方法,用概念(concept)表示文本,近年来的基于关系的ir技术有了重大突破,考虑了概念间的关系,把ir技术提高到新的层次。但是这种被称为基于关系的ir技术不是真正意义上的“基于关系”,因为系统根本不能提取出“关系”本身。关系获取(capture)是极富挑战性的。事实上,我们所有的工作都是基于对关系(relationship)的以下认识:

1)关系分为固有关系或长久关系(intemal/permanent relationship)和临时关系(temporaryrelationship)。

2)ir领域的关系抽取有别于ie的关系抽取,由于二者的功能和目的不同,后者偏重于固有关系或者长久关系,在抽取出的实体的基础上,在脱离文本的情况下,通过一定的手段,如知识库或机器学习,获取实体间的关系,其中关系的类型可采用ace测评给出的预先定义。

3)在ltmls, wordnet中记录的一般为固有关系,不同于文本中出现的概念之间的直接关系(一般由动词表达),是经过专家论证过的确实存在的知识。umls中的关系是定义在语义类型上的关系(如:isa);wordnet中定义的关系是相对于词性的(例如名词存在反义、上下位、部分整体、属性关系)。

4)在文本中多数的概念对(指在一个句子中的两个概念)间的直接关系(指与概念在同一个句子中的关系)为临时关系,这类关系还未得到专家的验证,还未固化为长久或固有关系。ir主要用于发现和检索后这一种关系,固有关系可以作为有益的补充。

(一)基于关系的查询与文本的表示

(1)查询与文本的类型

1.查询具有多样性:

1)项查询(term query):这种查询方式还在普遍使用,其特点为多个(>=1)查询项(term) 组成一个查询,项之间可能会存在较强的关联。

2)问句查询(question query):问句查询是近年来应用的趋势,很多解释叙述型查询都可以转化为问句形式。

(2)查询与文本的三元组表示

1)概念的表示:鉴于基于关系的ir系统要在概念的基础上定义关系,所以应该支持对概念的表示格式,其中cui (unique identifier of concept)是概念的唯一识别码, tui(unique identifier of semantic type)是概念的语义类型的唯一识别码,str(string)记录文本中出现的字符串,attribute记录文本中概念的属性(不同于umls定义的attribute), location用来记录概念在文本语句中的偏移量,用以定位概念对(concept pair)之间的关系;是需要检索的未知(unknown)信息,未列出的概念和关系的参数取值为空。

2)关系的表示:其中关系是原子关系(atomic relation),即关系中无并列成分,是保证完整语义的最小单位;rcui(unique identifier of relation)是关系作为某种意义上的概念在wordnet中的唯一识别码,@rcui(unique identifier of relation'shypernymy)。

(二)关系的抽取与整合

1、抽取关系

首先,动词也存在同义词和近义词,但是对于名词的同义词和近义词,某些领域本体库已经给出了它们对应的概念及其编号(umls中记为cud,大大减少了多词同义、多词近义而词形不同带来的麻烦,但是这些本体库并不涉及动词;其次,有些其他词性的词,如某些特殊的名词代表某种动词的涵义。如果将此类情况忽略,一定会影响检索性能。但是,如果可以根据同义近义将关系归类编号,压缩为数量不多(umls中有50多个)的语义关系,就可以很好的解决上述问题,这也是处理体现关系的动词的最实用的方法。幸运的是wordnet提供了可以解决以上问题的机制,我们的系统就是将领域本体库umls和广泛本体库wordnet结合起来用于概念和关系的抽取。

2、表示关系

获取关系的工作完成后就要用适当的方式表示关系,关系表示的正确性和简便性直接影响了irir系统实现的复杂度,也关系到检索的性能。

(三)关系的整合

首先计算概念对的中心位置;关于概念配对,我们采用关于实体一实体关系生成的方法。概念对(concept pair)与关系列表(relation list)中第n个的关系组合形成三元组,即表明该关系与概念对在同一个句子中,并且距离概念对的中心位置最近。在得到triple三个分量的值以后,就可以应用不同的策略界定与triple对应的文字段(passage)的偏移量和长度了。文字段的界定策略有多种,本文使用的是以句子为最小单位组成文字段的策略,即文字段的起始(offset)是关系所在的句子的偏移量,文字段的长度(length)是该句的长度。

(四)相关判定一排序机制

相关判定一排序原则:1)匹配最佳优先原则:文本triple匹配上查询triple的分量越多排序在前:2)概念匹配优先原则:概念包含的专业信息更丰富,因此匹配时概念较多的文本triple排序在前,只有关系分量匹配上的不判定为相关;3)当topic处理为多个triple,每个triple按相同权重(=1)分别进行检索。

相关判定一排序(judginges ranking)方法将第k个文本triple比对第i个topic的第j个查询triple,根据匹配上的分量类型和数量打分,概念分量匹配上多的分值较高(=文本triple[k]分值*加权值0.4,文本triple分值即为该triple在语料库中出现的次数),关系分量匹配上的分值较低(-文本triple[k]分值*加权值0.2):对于查询triple中关系是多义的情况,首词义(a)或次词义匹配上时文本triple的排序计算公式(见算法2中式((1))的加权值((weight)分别为1和0.4,对于关系是单义的情况,排序计算同(a);合并处在同一文字段的不同triple,累加其排序权值(rankvalue),最后按分值高低提交triple对应的文字段(即triple表达式中的passage部分)。

即时通信基本概念篇2

[关键词]本体 评估 指标体系

[分类号]G354

面对众多已构建的本体,如何将其选择重用与共享是许多研究者所面临的问题。从某种层面上看,本体评估的意义在于保证本体的构建质量,实现对本体的有效管理与维护,从而为本体构建者提供参考依据,为本体使用者提供选择依据。从国内外本体评估研究看,目前主要采用基于用户、基于任务、基于原则、基于应用、基于黄金标准、基于语料库等评估方法,基于不同的需求目的,每种方法均存在其各自的特点与不足。总体而言,这些评估方法更多地注重结果评估,对本体所拥有的概念及概念关系、应用状况等进行评价,而忽略过程评估,如缺乏对构建规划、构建过程的评估。因此,本文基于本体建设的生命周期阶段,即原模型阶段、模型阶段、应用阶段来构建本体评估指标体系,旨在确定一套科学、合理、全面、客观的本体评价体系,可用于本体建设不同阶段的参考与评估。

1 本体评估内容

评估内容的多元化是评估本体的核心。就评估内容而言,多元评估要求既要体现其共性,更要关注各自本体的个性;既要关注结果,更要关注过程。即以多维视角的评价内容和结果,综合衡量本体的发展状况与水平。本体的评估内容可概括为以下几个层面:

1.1 本体概念层评估

概念是本体的最基本单元,概念表达的准确性、完整性、概括性、抽象性等对于本体的质量有着决定性的影响。

1.2 本体结构层评估

主要包括本体概念体系的结构化及本体表示体系的结构化。本体概念体系的结构化表现为本体概念结构的灵活性及易于扩展性;规范化、结构化的本体表示语言为本体在不同系统之间的导人和输出提供标准的机器可读格式,利于被计算机存储、加工、利用,或在不同的系统之间进行互操作,为本体表示体系的结构化提供了前提条件。

1.3 本体语境层评估

本体语境层表示为本体之间的关联度,通常情况下,本体之间通过建立映射、互相参考引用等方法建立概念间的语义关联,以实现本体之间概念及概念间关系的重用与共享。可通过链接或引用程度不同给予不同的评估值。

1.4 本体应用层评估

以本体的应用领域作为评估对象,涉及本体系统的存储与检索、基于语义网知识层的共享和重用、基于本体的标引与语义检索、文本数据的推理研究等。本体应用层相对于其他层面,影响较小且具有间接性,因此评估难度较大。

2 本体评估指标的构建

本体从构建到应用要经历整个生命周期的三个阶段:原模型阶段、模型阶段、应用阶段:①原模型阶段是本体构建前整体规划及原材料的预处理过程,包括构建本体的参考本体及可行性评估、流程设计、数据库设计、整理网页、挖掘文本语料库等;②模型阶段是本体构建过程,包括概念及概念间关系确定、本体构建的方法和工具选择与应用、本体与其他本体的映射、本体描述语言的选择与应用、本体之前的训练和测试;③应用阶段是本体构建完成后的本体应用状况,主要是运行中本体的监测活动,如知识工程、信息标引与检索、语义web、异构信息集成、本体推理等众多领域。

为实现对本体的整体性及动态性评估,需要对本体建设生命周期三个阶段的关键要素进行提炼,形成一套科学、合理、系统化的评估指标体系,这样既能测度本体构建水平又能评估其运行情况和发展潜力。本体评估指标体系,如图1所示:

2.1 原模型阶段

本体的原模型阶段评估的主要内容有:确定构建目的、构建规划、可行性评估、原材料预处理及选择参考本体。

2.1.1 确定构建目的 确认所构建的本体是否有明确的符合学科建设的发展定位,是否有明确的符合知识组织、知识服务的建设理念,是否有总体建设目标与中长期发展规划,是否有实现目标的方法和措施。

2.1.2 构建规划 包括:①用户需求分析。确认是否有明确的应用需求,是否有可操作的调研计划,是否有详细的调研方案,是否有成文的调研报告,是否了解学科资源状况,是否掌握用户需求及特点,并评判服务模式是否有明显优势,建设效益是否显著。②方案设计。检测构建本体的具体内容,包括确定项目的进度,规划实施方法,评判项目的可操作性,标准本体模型实现计划等。③团队建设。主要是明确构建本体的人员配置,要求有稳定的团队,并且应熟悉掌握知识组织的理论和方法,另外还应配备技术支持人员和领域专家。④经费管理。此阶段应该有经费预算和时间预算,经费应按预算分阶段地持续投入。⑤人员合作。在本体构建的全过程都需要本体开发师(负责构建本体)、本体工程师(重用本体)、项目负责人、领域专家、行业分析家及用户进行合作共建。

2.1.3 可行性评估 可行性评估的目的是确定是否能够用最小的代价在尽可能短的时间内解决问题。它并不是解决问题,而是确定问题是否值得和能够去解决,包括:①技术可行性,即使用现有的技术是否能够实现构建目标;②经济可行性,即本体的经济效益是否能够超过其开发成本;③操作可行性,本体应用系统的操作方式在本体的用户组织内是否行得通。

2.1.4 原材料预处理 预处理是由本体工程师在构建本体前对构建本体时所需的原材料进行收集与预处理,包括流程设计、网页整理、文本语料库的挖掘及对参考本体的资料获取等。在这些收集好的材料被使用之前,本体工程师还要对其质量进行评估。

2.1.5 选择参考本体 包括对本体构建所参考的其他本体的质量进行评估,并对所构建本体与参照本体的相关性进行评价。

2.2 模型阶段

2.2.1 本体概念构建的评估 本体概念来源于文本语料库和专家的参与,以定义新概念、复用且修正参考本体中的概念等。本体概念的评估包括:①概念的完整性评估。本体的概念完整性表现为尽可能包括学科或领域的全部概念,尽管很难达到,但应包括学科领域的基本概念和重要概念、反映学科的新概念和专用术语、体现交叉学科与边缘学科的所有概念。并在此基础上,参考用户的特点与需求,使其达到最佳使用效果。②概念的正确性评估。本体中的概念术语应明确、清晰、无歧义定义,一词一义,词型简练,稳定性强。③概念共享性评估。是指本体中术语所表达的概念与观点应具有普遍性,能够被整个群体所接受。④概念可扩充性评估。概念可扩充性主要表现为在本体的发展及应用过程中应该能加入新的概念。良好的可扩充性使得本体能够随着概念的逐渐增加而不断完善,同

时这样的本体也很容易对其进行概念的修改和删除。⑤概念抽象性评估。是指概念主要体现为基本的、普遍的、抽象的和哲学上的概念,通常顶层本体概念的抽象性更高一些,领域本体是从顶层本体的抽象概念中衍生出具体概念。

2.2.2 本体概念间关系的评估 概念间关系形成的概念网络体系,使各个概念之间建立起语义关联,为其在自然语言理解应用方面奠定了一定的基础。本体概念间关系评估的内容主要包括:①一致性检测。本体系统中概念、断言以及其他各种概念间的关系,前后定义是否具有语义冲突,需进行概念间关系的逻辑一致性检测。②完整性评估。概念间关系是否囊括了学科所有概念的概念间关系及其类别是否完整。③可扩展性评估。本体概念间关系应具有可扩展性,以便在本体应用或后及时增加与修改。④唯一性评估。本体概念间关系应具有唯一性,即概念与概念之间只存在一种关系。

2.2.3 本体映射评估 一般情况下,本体映射是基于概念定义的方法,即在映射时主要考虑本体中概念的名称、描述、关系、约束等。本体映射评估包含:①本体间的互操作性。主要针对本体间映射时的接口进行评估。一般情况下,如接口衔接率高,即需要人工进行概念扩充与整合的接口比较少,则说明两者的互操作性高。②重用性。重用的内容包含两个本体的概念、概念关系、属性限制等,通常重用率越高,映射的效果越佳。

2.2.4 本体表示评估 本体开发中,本体表示是对概念及概念之间的关系进行明确定义,选择合适且适用的本体语言,如DL、RDF、RDFS、Ontolingua、OKB、Loom、DAML,DAML+OIL、CycL、OWL等进行形式化描述。评估内容包含以下方面:①语言规范性。所选择的本体表示语言对本体知识的主要元素、概念、分类体系、关系与函数、实例、公理、产生式规则进行定义时,其语言结构是否规范,语言的推理机制是否合理。②逻辑错误检查。确认是否有逻辑错误的检查能力及检查其结果如何。③语言错误检查。确认是否有语言错误的检查能力及检查其结果如何。④语言的适用性。确认所选择的本体表示语言是否适用于表示目标本体,它对知识主要元素的定义能力如何。

2.2.5本体构建工具评估 目前较为成熟、知名度较高且常用的本体构建工具主要有:DAMHmp(API)、KAON、OilEd、OntoEdit、OpenCyc Server、Protege-2000、 RDFAuthor和WebOnto等。判断一种工具性能如何,主要是判断其是否具有较高的使用效率和是否便于用户使用:①可视化程度。本体构建工具是否提供可视化的本体表达视图,提供的用户界面是否便捷并使用户满意。②共享性。本体构建工具是否可供用户免费使用、下载或在线使用,提供免费软件下载的官方网站是否具有多种语言的版本。③适用性。本体构建工具是否支持Unicode字符集,工具在使用时其输入和输出格式是否支持XML或其语法是否基于本体标记语言XML以及W3C、ISO或IEEE等其他国际组织的相关推荐标准。

2.2.6 本体整体评估 本体整体评估主要是针对本体的构建过程作出整体全面的评价:①开放性。开放性有助于促进本体与其他本体信息的共享及互操作性。完全开放意味着本体可以被自由使用或者扩展,而不加任何限制。一定程度的开放意味着本体提供者要求本体使用者遵循一定的使用条款及许可条件,实现限制条件下的部分开放。②成熟度。主要指本体目前发展的稳定性及其与其他本体的相关性。它通常与一些量化指标有关,如本体的建立时间、更新时间、发展状态及被其他本体引用的程度等。③阶段评估。本体是否进行了阶段性评估,评估的结果如何,阶段性的问题是否解决,有没有对本体进行阶段性训练和测试。④时间成本。本体的构建时间是否在预期时间内完成。⑤费用成本。构建本体的费用是否在预算费用之内。⑥本体管理。包括本体的进化管理、版本管理、存储与交换管理。要求有本体专门维护机构,有科学的理论依据与实践依据,并依据学科发展和标注实践制定了本体概念与概念关联的增、修、删的原则与标准。本体有不断更新的版本以及现实本体的稳定运行、本体存储方式、高效的存取性能、遵循有关标准协议、能够实现不同本体间数据的相互交换。

2.3 本体应用阶段

本体的应用评估主要包含:本体系统辅助功能、语义标注功能、语义检索功能及文本推理功能。

2.3.1 本体系统辅助功能 本体系统辅助功能主要指该本体所提供的服务功能。主要包括以下内容:①与用户的交互。是否提供了与用户的交互机制,提示信息有效、直接,交互语言友好,可视化结果直观、易懂,能够为用户的操作提供适当的引导。②开放性。与本体管理工具和本体应用系统连接的难易程度以及对用户来讲是否容易使用与操作,是否可以免费获取,获取的方式是否快捷等。③个性化服务。所构建的本体应该提供信息定制服务与信息推荐服务,要有清晰的整体说明、详细的功能使用说明与信息注解、帮助信息,并可根据用户关注焦点来选择个性化服务。

2.3.2 语义标注功能 语义标注实为运用本体的词汇来标注语料库与web资源,通过添加语义元数据,使其内容被人或机器所理解。语义标注所要评估的内容是覆盖率、标注工具的效用性、标注结果的准确率。①覆盖率。覆盖率是指本体中描述应用领域的概念在语料文本词汇中所占的比例。覆盖率越高,说明本体描述领域内概念的广度越高,全面性越好。②标注工具的效用性。检测标注工具是否支持各种类型、各种介质资源的自动标识,是否提供了本体概念和关键词标注,是否描述了元数据的标准与通用性,标注流程是否方便,且对于应用用户是否适用。③标注结果的准确率。是指正确的标注结果数占标注数量的比率。准确率越高,语义标注功能越强,可以为进一步的语义检索奠定基础。

2.3.3 语义检索功能 基于本体的信息检索,旨在利用本体中的概念实现对用户信息需求及资源的语义理解与分析,实现概念层面的检索,提高查询的精确率。其功能评估包含以下内容:①查准率。指系统所检索出的术语中有多大比例的术语是相关的,而不考虑它没有检索出的相关术语。精确度越高,就越能有效地确保系统已识别的术语是正确的。②召回率。召回率是系统检索出的相关术语占总相关术语的比例,即检测有多大比例的术语是系统应该识别而实际上识别了的,而不考虑有多少不合格的识别术语。召回率越高,就越能确保系统没有错过正确的术语。③自然语言处理能力。检测系统识别用户检索语言的能力,即问答系统根据上下文的语义联系具有深层语义理解的能力。比如,对一词多义现象的处理,对开放域的答案抽取水平,所涉及的词法分析、句法分析、语义理解等基础处理能力。④用户满意度。是指用户对输出端结果的满意程度,即输出的结果是否为用户所提问题的答案,涉及答案的详细程度、输入端与输出端的时间间隔及人机界面操作的便捷性等。

2.3.4 本体用于推理 本体描述语言起源于人工智能领域对知识表示的研究,因此本体的描述语言不仅仅需要具有良好定义的语法和语义与充分的表达能力,更需要有效的推理支持:①工具的有效性。推理工具是否支持多版本的语言规范,是否可以方便地访问标准语言的类及属性,是否支持基本的对list的处理,是否可以实现类的层级访问和使用,是否可以实现自动或半自动推理等。②概念的可满足性。是否存在相应的解释使得概念成立。③实例检测。是指检测某个概念所对应的所有实例的集合。

即时通信基本概念篇3

关键词:数据元素;数据;数据标准化;元数据;信息分类与编码

1 数据元素基本理论

1.1 数据元素及相关定义

在数据元素理论研究中,下面的术语是很重要的,理解好这些术语是理解数据元素的基础。

①数据元素(Data Element):用一组属性描述定义、标识、表示和允许值的一个数据单元。

②数据元值(Data Element Value):数据元能许值集合中的一个值。

③数据项:数据元的一个具体值。

④同义名称: 与给定名称有区别但表示相同的数据元概念。

⑤限定词:帮助定度和呈递唯一性概念的术语。

⑥域:一种属性的可能数据值的集合。

⑦值域:允许值的集合。

⑧域名:将数据元的值域及度量单位利用一个统一的名称来表示。

⑨对象类:对象集,现实世界中的想法、抽象概念或事物集合,有清楚边界和含义,并且特性和其行为遵循同样的规则面能够加以标识。

⑩对象:可要想象或感觉的世界的任一部分。

(11)特性:对象类的所有个体所共有的某种性质。

(12)表示:值域、数据类型的组合,必要时也包括度量单位或字符集。

(13)对象类词:数据元名称的成分,用于表示其所属的对象类。

(14)特性类词:数据元名称的一个成分,用于表述对象类的特性,(数据元名称的一个成分,表述数据元所属类别)。

(15)表示类词:数据元名称的成分,用于描述数据元的表示形式。

(16)数据模型:以反信息结构的某种方式对数据组织的某种描述。

1.2 数据元素规范与标准化框架

1.2.1 数据元素的组成

数据元由对象类、特性和表示三部分组成,其中对象类用于收集和存储数据的事物,例如,人、井、岩芯、管线、储罐都是对象类等;特性是用来区别和描述对象的,例如,颜色、性别、年龄、收入、地址、价格等均为特性;数据的表示部分中最为重要的方面是值域,值域是数据元允许(或有效)值的集合。对于值域,数据元中存在两种类型的值域,一种是所谓取值是固定的,即取值是可枚举的,例如,人眼睛颜色这个数据元,其取值可能包括:Brown、Gray、Green、Hazel、Blue,另一种是概括的,即数据元取值是有定义域约束的,其取值可能是有限的,但是无法列出全部值,例如人的年龄,其取值范围可能是1-200,并且每位要求是十进制表示。

1.2.2 数据元结构模型

(1)数据元概念(DEC):对象类与特性联合在一起形成数据元概念,数据元概念在数据分类中是非常有用的,一般来讲,数据元概念是一个抽象意义上的数据元,但这类数据元的对象类已经限定,只有经过对数据元概念中的各个要素再进一步的限定,才使数据元概念变成真成有意义的应用数据元素。所以,数据元概念本身具有抽象性与分类性。

(2)通配数据元:特性与表示联合在一起形成通配数据元,通配数据元素也具有抽象意义,对于这类数据元来讲,它的特性与表示已经确定,所以它具有通配性,如果将这类数据元与具体的对象类联系在一起,那么该类数据元就可以具体化为有意义的应用数据元。

(3)数据元类型:数据元概念与通配数据元形成数据元类型。 转贴于

数据元是由数据元概念和表示两部分组成。当一个表示被联合到一个数据元概念上时,就能够产生数据元。数据元和数据元概念间存在多对1的关系,也就是一个数据元必须对应一个数据元概念,而一个数据元概念可以有多个数据元,换句话说,多个数据元可以共享一个数据元概念。

数据元与表示之间的关系是一对一的关系,也就是一个数据元需要一个表示。当数据元的概念模型相同而表示不同时就是两个不同的数据元,数据元中的表示是描述数据元中的数据元概念中的特性,即数据元中的特性有且仅有一个表示。

在数据元概念中对象类和特性之间是一对一的关系,一个对象类需要只需要一个特性(或者特性类),一个特性(特性类)只描述一个对象类,当一个特性和一个对象类建立关联时就产生了一个数据元概念。

同实体关系类的数据模型相比,模型中的实体相当于数据元中的对象类,而实体的属性本当于数据元中的特性和表示。

1.2.3 数据元素的属性

数据元素本身也是一个事物,既然是事物那么就需要属性来描述这一事物,通常我们也将描述属性称为描述数据元素的元数据。

1.2.4 数据元结构模型

经过对数据元理论的深入研究,我们抽象出图2的模型,该模型反映出了数据元概念、表示、基本数据元以及应用数据元间的关系。

1.2.5 值域基本模型

按照数据元素理论,给出了数据元的值域模型。该模型将数据元素的值域抽象为概念域,即所谓的“域名”,一个概念域可能会与多个值域有关系;概念域可能是枚举类型的,也可以是非枚举类型;同样,值域可能是枚举值域,也可能是非枚举值域。

2 数据元的元模型

经过对数据元理论与实际数据规范化应用的研究,我们提出了数据元的元模型。

该框架模型是将对象类、特性类、分类模式由此演生的基本数据元和应用数据元、值域以及数据标准值、实例标准值以及标准实体有机的关联在一起。揭示了数据元与应用的紧密关系。整个模型高度概括了数据标准化的核心工作。

3 数据元素与信息编码间的关系

有些学者讲过,信息标准化实质是信息代码化的过程,周知,信息分类与编码在整个企业信息标准化中占有基础的不可替代的地位。因此如何对企业的各种信息进行有效的分类,并对其进行编码这是信息化过程中一个非常重要的过程。其实数据元素与信息分类及编码有着密不可分的关系,在表1中给出了数据元素分析方法与信息分类与编码的对应关系。

4 数据元应用的领域

数据元素理论属于信息标准化的基础理论,即是数据规范化理论基础。数据元分析在信息分类、数据的集成参考模型、数据模型优化设计、数据元字典以及制订数据交换标准等方面得到应用。

数据元的研究,目前在国际上相当流行,而在国内的研究还处于起步阶段。通过几年的研究,目前,我们已经将这一方法论用于石油上游的数据规范化中,并取得了良好的效果,目前,正在将这一方法论用于中石油的ERP数据平台中的数据规范化中。相信,随着这一方法论的在石油石化领域的不断应用,必将为石油石化信息化建设起到科学的指导与推动作用。

即时通信基本概念篇4

以“基因对性状的控制”为例,围绕核心概念设计基于探究的教学活动,帮助学生获得核心概念。

【关键词】核心概念;推理探究;中心法则

核心概念是处于学科中心位置,并对学生学习具有重要意义的基础知识。围绕生物学核心概念来组织并开展教学活动,能有效地提高教学效率,有助于学生对知识的深入理解和迁移应用。教师在设计和组织每个单元的教学活动时,应该围绕核心概念展开,其中教学具体事实应该作为铺垫来帮助学生发展深层理解;教学重心应该从讲授事实转移到使用事实,以便传递和评价更深层的理解力;学习重心也应该从记忆事实转移到理解可迁移的核心概念和对更为根本的知识结构进行深层理解,培养和发展思维能力。本文以人教版高中生物必修2中“基因对性状的控制”为例,围绕相关的核心概念设计并开展以探究为主要途径的教学活动,帮助学生理解和把握本节课的核心概念。

⒈教学背景分析

本节课要落实的高中生物学课程内容标准是:“遗传与进化”模块中“基因对性状的控制”这一主题下的“明确中心法则中遗传信息的流向”“举例说明基因、蛋白质与性状之间的关系”。“基因对性状的控制”一节是人教版《必修2·遗传与进化》第四章第二节,之前教材已在第二章和第三章就“基因在哪里”和“基因是什么”的问题上作了详细阐述和分析,接下来研究“基因是如何起作用的”,即第四章对基因的表达问题进行研究。本章第一节着重探讨了“基因指导蛋白质的合成”问题,紧接着第二节就基因如何控制生物体性状展开分析,与教材之前知识内容层层推进,从微观到宏观,解释了生物体多样性的内在原因,而教材第一、二两章又恰恰是从宏观现象到微观分析了遗传现象到控制因素的过程,本节与之相呼应;并为解释第五章“基因突变及其他变异”奠定了理论基础,故可见本节内容不仅在教材体系上起到了“结构桥梁”的作用,并体现了人类认知事物的一般规律和研究方法。通过本节课的学习,学生可以将基因对性状的控制中的核心概念纳入到已有的概念框架中,并为理解性状变异的原因打下良好的基础。

⒉本节内容的核心概念

生物学的概念之间是有层次关系的,有些概念是该主题中最重要的概念,处于该主题的核心地位称之为核心概念。有些概念则是为核心概念的形成打基础的,可以称之为相关概念。教师基于对课标、教材以及学生学习情况分析基础上,用陈述句清晰地表述出学生应获得的核心概念及相关概念。

本节课的生物学核心概念是:中心法则基因对性状的控制

⒊教学目标

⑴知识目标:“举例说明基因与性状的关系”,属于“理解水平”。这项要求包括三层含义:一是理解基因的概念和本质;二是理解基因的表达过程;三是理解从基因到性状的控制过程及其所对应的具体实例,并能运用所学知识分析相关事例。

⑵能力目标:本节以生物的具体外在性状分析入手,学生以原有知识结构为基础动脑分析事物现象背后的一般规律,培养学生从实验证据分析得出结论的能力。

⑶情感态度与价值观:认知科学研究是不断深入的,是一个从宏观到微观,从现象到本质而后又从微观到宏观、本质到现象的认知过程,要树立科学的认知观和发展观。

⒋教学策略

课堂教学过程中注意设计巧妙的学习探究情景,给予丰富的资料信息和具体事例,组织、指导启发学生,并积极的参与学生的学习、讨论过程。引导学生自主分析问题,真正培养学生初步学会从现象归纳到本质和从本质延伸到多种现象的分析解决问题的能力。因此本节课选择采用“5E教学模式”组织课堂教学,它是由美国生物课程研究所(BSCS)所开发的一种建构主义教学模式,它引导学生按照学习经验的先后顺序,经过参与(Engagement)、探究(Exploration)、解释(Explanation)、精制(Elaboration)和评价(Evaluation)5个阶段的学习,建构对核心概念的理解。本节课的教学由5E的5个阶段组成,每个阶段的教学设计都围绕该阶段学生需获得的核心概念展开设计,期待用这种教学组织形式吸引学生主动思考,通过推理性探究活动理解核心概念。

⒌教学过程和组织

⑴参与阶段

①核心概念本阶段的核心概念是遗传信息的流动规律。此概念包括3个相关概念,即遗传物质是DNA或RNA,甚至是蛋白质;遗传信息的表达即遗传信息通过什么方式以蛋白质的形式表现出来;蛋白质是一切生命活动的承担者和体现者。

②围绕核心概念的教学

㈠设置情境引发学生对“遗传信息流动”的好奇心和兴趣,情境可采用多媒体展示喜剧明星陈强与其儿子陈佩斯的照片,提问:他们有什么相似之处?这些相似之处是怎样形成的?展示科学研究从现象到本质的探究思路。

㈡帮助学生建立新旧概念之间的联系:请两位同学在黑板上尝试写出遗传信息的传递途径。之后要求全班同学结合教师给出的DNA复制过程和基因指导蛋白质合成过程的Flas的对两位同学的回答做最终的评定,从对DNA复制以及蛋白质合成的旧概念认识上引出可里克的中心法则的这个新概念,接下来带领学生自主阅读课本的资料分析并进行讨论探究,培养学生阅读并获取信息的能力,完善对中心法则这个概念的理解。

㈢提出新概念研究的问题。教师可以给出反映几类生物遗传信息的流动的图示,让同学们进行进一步分析并思考它们的共性,就是遗传信息为什么都流向蛋白质的问题,为了更全面透彻的理解中心法则的内涵,教师必须带领同学们进一步思考上述问题并开始着手研究基因和蛋白质、性状之间三者的关系。

⑵探究阶段

①核心概念本阶段的核心概念:基因,蛋白质,性状的关系

②围绕核心概念的教学:本阶段需要把学生们分4组并根据给出的具体的性状实例探究其产生的原因,同时得出与基因与蛋白质,性状之间的关系。

合作推理探究一:豌豆的圆粒和皱粒;首先用多媒体展示圆粒和皱粒豌豆图,让同学们结合生活实际思考并讨论二者形态上差异产生的原因,然后把4组讨论的结果放在一起进行再讨论遇到无法解决的新问题:圆粒和皱粒豌豆在成分上的区别是什么原因导致的,所以此时探究遇到了“瓶颈”,此时老师给予解释(蔗糖在淀粉分支酶的催化下可生成淀粉)后,同学们就此进一步思考皱粒豌豆可能是相关基因异常而不能正常表达,导致缺乏相关酶而使的蔗糖不能转化为淀粉,失水显得皱巴巴。这样便基因和蛋白质,性状之间的第一层关系(基因通过指导酶的合成,影响代谢,进而控制生物体的性状),并指出这层关系在生物界普遍存在并让同学们根据这层关系尝试解释白化病等其他多种性状形成的原因,以达到对这层关系更深入更全面的理解。

合作推理探究二:囊性纤维病的病因;根据课本文字和图片的介绍,结合教师备课准备的有关该病图象和文字材料,采用小组合作探究的模式进行推理,而理解的关键在于跨膜蛋白CFTR的结构和功能,学生们思考逐步认识到这种结构蛋白的异常影响到它功能的发挥,即氯离子的运输,从而导致患者产生一系列异常表现,进一步讨论总结出基因,蛋白质与性状的第二层关系(基因通过控制结构蛋白直接控制生物体的性状),同样再去通过尝试解释镰刀型细胞贫血症的病因达到巩固并提升理解能力的教学目标。

⑶解释阶段

①核心概念本阶段的核心概念是基因对性状的控制。相关概念是基因与性状并不都是一一对应的关系,基因分为质基因和核基因,质基因遗传遵循母系遗传;基因与基因,与基因产物,与环境是相互影响的整体共同作用实现对性状的控制。

②围绕核心概念的教学

本阶段的教学是对基因对性状控制这个核心概念教学的完善。通过多媒体展示图片如篮球明星姚明,激发学生们的兴趣并讨论他为什么那么高,然后得出身高等性状的最终形成除了受基因控制外还受环境的影响的结论顺理成章。紧接着通过展示线粒体肌病图片分析指出核基因遗传和质基因遗传的区别。

⑷精致阶段

①核心概念本阶段的核心概念是中心法则和基因对性状的控制。要明确指出理解两个概念不能彼此孤立,要能够看到二者的联系,既基因对性状的控制就是遗传信息表达过程的最终体现,不管性状的最终形成有多复杂,表现有多么多样化,它都是要遵循中心法则这个规律的,可以说中心法则是理解遗传的本质和核心,所以本节课是对遗传相关知识的一个拓展,总结和升华。

②围绕核心概念的教学

本节段通过对前面有关基因的知识的复习,学生共同讨论把遗传知识整合并结合具体实例发表各自的看法并进行概念图的绘制。

⑸评价阶段此阶段一方面通过课本技能训练分析长翅果蝇幼虫发育问题,请若干位学生进行尝试性回答,根据知识点回答的准确性和完整性评价对与核心概念相关知识的理解情况。另一方面请学生生完善黑板上概念图,达到对核心概念的理解进行了自我评价,也为教师评价学生是否达成教育目标提供了机会。

即时通信基本概念篇5

关键词:初中数学;函数概念;三种关系

初中阶段的函数教学具有承上启下的作用,是高中函数学习的基础,如果教学失败,直接对学生今后在高中阶段的函数学习产生负页影响,甚至影响到今后的进一步学习。所以,初中阶段的函数教学不可松懈,一定要慎重对待。就实际教学而言,初中阶段的函数教学一定要处理好几个概念关系,具体如下。

一、具体与抽象的关系

人认识事物都是从感性认知开始的,然后逐步升华到理性认知,理性的认知过程才是把握事物本质的过程。数学概念就是人们长期以来对事物现象形成的高度抽象认知的结果,函数更是如此。所以,函数的学习需要高度抽象的理性逻辑思维,这对理性思维尚不很发达的初中生来说,的确是有一些难度的。但一般而言,初中阶段的函数是基础性的,并不太难,并且考虑了与小学数学知识的衔接,所以,只要教师稍加引导,就会使问题迎刃而解的。

根据初中教材的一般编排规律,在引入函数知识前,已经作了许多函数知识铺垫,比如关于量与量之间的依存关系,学习函数前学生应当已有所认知并且可能很熟悉。初中数学教师完全可以在学生已有的有关量的知识基础之上,引导学生建构关于函数的知识结构,使学生在已有的数量关系知识基础上理解新的函数知识。

一般而言,在具体教学中,教师不宜直接向学生抛出抽象的函数定义,而要从具体的函数实例说起,引导学生从函数实例中抽象离析出变量、常量等,进而寻找各变量常量之间存在的数学关系,再根据关系建立数学表达式,进而使学生理解相关概念。最终学生会理解,对于一个变量X,含有X的代数式,如3X就是关于X的函数。

一切抽象的知识都是从具体的直观的感性经验开始的,因此,初中数学教师在教学抽象的函数概念时,也要尽可能引导学生从感性经验入手,从具体的实例如下,引导其一步步深入理解,最终完全掌握抽象的函数概念。

二、准确性与通俗性的关系

函数本来是高度抽象的概念,其定义应当时具有严密逻辑性的表达。但考虑到初中学生本身的认知水平,一般初中教材都采取描述法来界定,也主张教师用描述性的表达来界定函数之类的抽象概念。描述法界定的好处是通俗易懂,但也容易失去准确性。这就要求初中数学教师在界定概念时,必须力图做到通俗性的同时确保准确性。现行九年义务教育初中阶段某数学教材中这样定义函数:“设在一个变化过程中有两个变量x与y,如果对于x的每一个值,Y都有唯一的值与它对应,那么就说x是自变量,y是x的函数。”该定义突出了“对应”二字,体现了准确性;不把对应关系看作函数,而把变量y看成一个函数,这恰好是为了便于学生理解而所作的处理,因为变是y是具体的,而对应关系是抽象的,前者易理解,后者难消化。

有的老师在教学函数概念时,过于强调函数三要素,即“定义域、对应法则、值域”三要素。不过事实上,这三要素虽然是函数确实该具备的,但并不能揭示函数的本质。要想使学生准确理解,还必须揭示其本质属性。这需要从定义中析取。“在一个变化过程中”,强调函数的动态存在性;“有两个变量”强调函数体现的是两个变量之间的依存关系;“对于x的每一个值,Y都有唯一的值与它对应”强调两个变量之间的对应关系。从这三个方面的分析来看,函数本质上不是什么具体的变量,而是变量之间存在的一种对应关系。这样的抽象性的概念,要想理解准确,还真得从通俗性入手。

三、历史性与逻辑性的关系

一般而言,概念教学都有必要讲清概念的来龙去脉,这是历史性的体现。函数概念教学也如此,应当让学生了解函数概念的产生和发展的大致过程,使知识具有历史感,并有助于学生深化理解。逻辑性主要指共时平面上对函数概念的抽象界定,这样的逻辑性界定很直接地抛出概念定义,很省事儿,但不省力。因为直接面对抽象的函数概念,学生一时半会儿并不能理解。如果从此前的代数知识讲起,引导学生步步深入,体验函数关系如何从代数中生成并发展起来,体验完毕后,对函数就会有一个较为深刻的认知体会。这样以旧知识促进新知识的理解消化,也很符合建构主义理论。建构主义认为,人的大脑是建构性的,而不是直接的接收器或刺激反应器。人在接受信息过程中,会有主观能动性的参与,即人会对所接收到的信息进行加工,进而创造出新的信息体系。这个加工过程是复杂的,往往是新信息和旧信息均有涉及的一种建构性处理,经过这种加工,大脑中会建构起新的认知体系来。所以,人的学习应当是建构的,而不是接受的。函数概念教学中,教师也不能忽略大脑认知上的这种特点,所以也要根据建构的特性来组织教学。因此,逻辑性的函数定义固然省事儿,可以直截了当地告诉学生所学的内容,但由于缺乏既有知识作为基础,大脑中很难真正建构。只有从代数开始,以代数的知识作为基础,逐步引入函数,学生才可能在代数知识基础之上建构函数知识,实现对函数概念的准确理解。

综上,初中函数概念教学要处理好三种关系,一是抽象与具体的关系,即要从具体实例出发而理解抽象概念;二是准确性与通俗性的关系,即要以通俗的语言引导学生准确理解高度抽象的概念;三是历史性与逻辑性的关系,即要尽可能以历史的方法,讲明函数的来龙去脉,使学生建构性地理解逻辑层面的函数概念。处理好了这三种关系,初中函数教学就能化难为易,化繁为简,使学生学得有味,教师教得有劲。函数问题概念如能迎刃而解,其他数学问题的解决也就不再是什么难题。因此,初中数学教师一定要在函数概念教学上多下功夫,多结合实际认真探索,积极大胆地创新,在处理好以上三个关系的前提下,寻找最适切的教学方法,推动教学的良性发展。

参考文献:

[1]任子朝.数学思维结构的成分、建构与发展(续).数学通讯,1993,8

[2]严成志.理科教学中培养学生形象思维能力的研究.中学教研,1993.7

即时通信基本概念篇6

关键词:抽象概念:感觉运动经验;表征;具身认知

分类号:B842

1 引言

存储在长时记忆中的概念是人类知识和认知的基础。概念在大脑中如何表征不仅是认知科学的传统问题,而且也是具身认知(embodiedcognition)和离身认知(disembodied cognition)的核心分歧(jacob,2009;Kemmerer&Gonzalez-Castillo。2010;Mahon&Caramazza,2008,2009;Zahavi,2008)。按照“离身认知”的观点,心智可以脱离身体而存在,人类的概念系统与感觉运动系统相互独立,概念表征本质上是以非模态的抽象符号形式存在的。尽管离身认知理论也承认感觉运动信息能够对概念通达产生影响,并且会在概念通达中有所激活,但是离身认知理论认为,这种促进和激活只是辅或伴随性的,并非是概念表征的必要条件(Dove,2009;Mahon&Caramazza,2008,2009;Parisi,2011)。按照“具身认知”的观点,概念通过身体的感觉运动活动获得,不同的感觉运动活动在大脑中留下不同的感觉运动印迹(经验),与此对应,外部知觉、内部状态(躯体感觉、情绪、内省信息)和动作共同构筑了概念的表征。因此,概念表征本质上是模态的、灵活的神经表征,并非是独立存在的、稳定的符号表征,而认知就是感知运动信息以模拟的方式重新激活(Barsalou,1999,2008,2009;Gallese&Lakoff,2005;Glenberg et al.,2008;Lakoff&Johnson,1999;Pecher&Zwaan,2005)。由此可见,感觉运动经验在概念表征中的作用已成为当前争论的焦点。

主体通过身体经验对具体事物进行概念表征。已经得到了广泛的证据支持(见综述Barsalou,2008)。然而,诸如“时间”、“道德”、“公平”等抽象概念(abstract concept)是否具有感知经验基础则成为当前争论的焦点。离身认知理论认为,人类的感知经验本身并不足以建构抽象概念,抽象概念表征本质上是纯粹符号性的和非模式的。比如对于“时间”概念,我们既不能触摸到时间,也不能看到时间,更不能说听到了时间(Arbib。2008;Dove,2009;Jackendof,2002;Mahon&Caramazza,2008)。而具身认知理论认为,人类的知觉运动经验是抽象概念形成和发展的基础,比如我们以视觉的空间距离“长”和“短”来表征时间的“长”和“短”,以温度感觉的“冷”和“热”来表征抽象的“热情”和“冷漠”(Boroditsky,2000,叶浩生,2010)。总之,具身理论认为,抽象和具体概念一样,都建立在感觉运动信息的基础之上。

既然抽象概念不能像具体概念那样通过直接的感觉运动经验来获得,那么抽象概念与感觉运动经验之间如何发生联系就成为具身认知理论必须回答的问题(Barsalou,1999;Boroditsky,2000;Glenberg&Robertson,1999;Lakoff&Johnson,1980,1999)。当前,众多研究者在各自的具身认知框架下提出了关于抽象概念表征的理论解释。概念模拟理论(Conceptual Simulation Theory,Barsalou,1999;Glenberg&Robertson,1999)强调情景或运动模拟在抽象概念表征中的作用。概念隐喻理论(Conceptual Metaphor Theory,Lakoff&Johnson,1980,1999;Boroditsky,2000)则侧重具体经验以及具体经验与抽象概念之间的共同结构关系在抽象概念表征中的作用。需要指出的是,两者虽有区别,但并非完全相互排斥的。本文拟以抽象概念是否通过感知经验来表征以及如何被感知经验表征这两个问题为线索,阐述和总结当前不同的具身认知理论在抽象概念表征上的观点,并列举相应的实验证据,随后展望了未来可能的研究方向,即语言和抽象表征的关系、正常儿童和特殊群体的抽象概念表征问题。

2 抽象概念表征需要感知经验

抽象概念不仅是高级认知思维的基础,而且在社会交流、教育、工业等社会领域起着十分重要的作用。因此,如果“具身认知”不能清晰阐述抽象概念的表征问题,而被限制在具体概念(concrete concept)领域,那么具身认知理论只能算作“半具身认知”理论(Chatterjee,2010)。研究者为了利用“具身认知”来说明抽象概念的表征问题,纷纷提出各自的理论观点。其中,知觉符号理论(Perceptual Symbols Theory,Barsalou,1999)和隐喻表征理论(Metaphor representation Theory,Lakoff&Johnson,1980,1999)是较有代表性的早期理论。两者都强调具体经验在构建抽象概念表征中的重要作用。但是,知觉符号理论更加强调抽象概念本质的知觉性和通达的情境性,代表了“具身认知”理论中的强势假设(即抽象概念表征本质上由感觉运动信息构成);隐喻表征理论虽然也肯定感觉运动经验在抽象概念获得和理解中的作用,但是,隐喻表征理论认为大多数抽象概念是通过相应的具体图式来间接表征的,并且抽象概念的表征受语言文化的影响,这在一定程度上代表了“具身认知”理论中的弱势假设(即抽象概念与感知运动信息相联系,但并非必须是直接的联系)。

2.1 情境和内部知觉在抽象概念表征中的作用

Barsalou(1999)提出的知觉表征理论(Perceptual Symbols Theory)认为,概念表征由知觉经验构成(王瑞明,莫雷,2010;谢久书,张常青,王瑞明,陆直,2011)。由于抽象概念不能从外部世界的知觉状态中直接获得,所以我们不能通过“看”或者“听”直接得到抽象概念。Barsalou(2008)指出概念的表征(模拟器)并不完全来自外部世界的知觉状态,还能来自他人和内省信息(introspective information)。人们能够通过构建情景、物体和内省信息(如“害怕”)的形象,来知觉地模拟抽象概念的具体实例。例如,“真理”这个抽象概念,为了判断讲话者“外面是好天气”的命题是否正确,聆听者就会在大脑中模拟对应的情景,并与实际情景进行比较,决定说话者的判断是否准确。如果两者是匹配的,那么说话者的判断就是真理,经过比较过程的重复性体验,个体就形成了关于“真理”概念的模拟器。因此,抽象概念根植于复杂的多模态情景,内省信息在抽象概念的表征上起着中心作用,与此同时,情境信息和情境性动作也在抽象概念的表征上起着促进作用。从这点看,概念表征本质上是情境的,而情境就是一定时间内焦点物体的认知空间,该空间是从一个人的主观视角知觉到的,空间区域包含了各种实体和事件,而个体对其知觉又能诱发各种心理状态。概念表征中存储的情景信息来自两个方面,一方面是概念样例发生情景中的空间和时间信息,另一方面,意义关系和注意焦点可能存储了与有机体活动相关的其它情景信息。

另一个值得关注的问题是,抽象概念和具体概念的表征差异性是什么?知觉符号理论认为,尽管两种概念都是基于情境的,但是他们各自侧重情境信息的不同方面。具体概念更加关注情境中的物体,而抽象概念更加关注内省信息、事件以及两者之间的关系,因此具体概念通达产生更多的物体和场景信息,而抽象概念通达产生更多的内省和事件信息。Barsalou和Wiemer-Hastings(2005)利用特征列表任务来验证抽象概念与具体概念的内容差异,实验要求被试提取抽象概念和具体概念的特征,然后对特征进行编码归类。结果表明,被试对抽象概念提取的特征,更多的是事件和内省信息,而具体概念多是实体和场景。另外,Schwanenflugel,Akin和Luh(1992)的研究还发现抽象概念的情境信息提取相比具体概念而言更困难。因为与具体概念的特征提取相比,抽象概念的提取由于情境信息更加多样和复杂,这些情境信息在提取过程中相互竞争和干扰,因此造成提取过程更加困难。

2.2 隐喻在连接具体经验和抽象概念中的作用

Lakoff和Johnson(1980,1999)认为隐喻作为人们认识世界的基本思维方式,是通过将源域的图式结构(具体的感觉运动信息)映射到目标域(非感觉运动信息)上来表达和理解目标域的。该理论认为,人在生活中只建构了一小部分直接来自于经验的概念,这些基本概念包含了部分的空间关系(如“上-下”、“前-后”)、物理包含关系(如“个体”、“容器”)以及动作经验(如“吃”、“移动”)。在人的概念系统中,还存在着大量抽象的、非直接经验的概念,如“时间”。人们无法直接地从经验中获得这些概念,往往借助于表示具体事物的词语表达抽象概念,而不必直接借助于感觉运动经验。

支持抽象概念的隐喻表征理论的证据大多来自“时间”等概念表征的研究。其基本假设认为个体用从环境中直接获得的空间关系来组织时间概念,当这种抽象事物的具体化表征被人们熟练地使用以后,具体的空间特征将会内化,无需单独地提取。并且语言使用习惯对选择何种空间关系来表征时间起着重要作用。Boroditsky(2000)通过控制启动信息来考察时间概念和空间关系的联系,发现在人们头脑中存在着时间隐喻图式,时间隐喻图式包含有一定的空间信息(如“前-后”、“左-右”、“上-下”),能够使时间等抽象概念得以具体化地表征。Boroditsky(2001)的研究表明母语为汉语者更倾向于使用垂直图式(上-下)来表征时间,母语为英语者更倾向使用水平图式(左-右)来表征时间。进一步研究发现,第二语言习得年龄影响这种倾向性。值得注意的是,上述实验大多采用句子描述作为时间表征刺激。为了排除语言的影响,Casasanto和Boroditsky(2008)采用变化的线段作为材料,让被试复写线段的长度或时间的长度。结果发现,即使在非语言的状态下,时间估计仍然受空间信息的影响。上述研究表明,人们在物理表征经验的基础之上表征抽象的事物,当隐喻使用熟练到一定程度时,隐喻表征就可以在非言语的任务中出现。Crawford(2009)更进一步指出,大多抽象概念表征的研究都来自视觉表征在抽象概念隐喻中的作用,而抽象概念的表征应该是多通道的,时间概念也可以通过听觉通达中的左右维度来表征。比如,Lakens,Semi和Garrido(2011)通过听觉通道向被试呈现表示过去的词和表示将来的词,实验任务为指出哪个耳朵中声音更大。结果发现,尽管向两耳呈现词的实际音量一样大,但是当表示未来的词呈现在右耳时比呈现在左耳时,被试更容易判断右耳词的声音大,说明被试倾向于用右表征将来,这种倾向性提高了被试的敏感度。

上述研究表明具体经验和抽象概念之间存在非常强的联系,在一定程度上支持了隐喻表征理论,但隐喻表征理论不能清楚的说明基本的意象图式、个人经验、情景信息和整个知识在何种情景下激活何种概念映射。并且概念隐喻理论本身来自语言领域,语言中的模式并不一定反映思维中的模式,况且这种理论相对缺乏可验证性。

总之,上述两种理论都通过理论和实验说明,尽管个体不能直接通过感知经验来获得抽象概念,但是抽象概念的表征仍然具有感知经验基础。但在感知经验如何与抽象概念表征发生联系的问题上,一方面,Barsalou的知觉符号理论没有阐明什么情境构成了模拟的首要因素;另一方面,Lakoff的隐喻表征理论也没有阐明具体经验中的什么特性才能映射到抽象领域。总之在感知经验与抽象概念表征的联系机制上,上述两种理论都缺乏可验证性。于是才产生了更加具体的索引假设和隐喻结构观。

3 抽象概念表征与感知经验的联系机制

3.1 情境和动作模拟在抽象概念加工中的作用

按Barsalou(1999)的知觉符号理论,运动镜像就是动作的内隐复演,而镜像被认为是一种回顾,是为了提取通过知觉获得的已有知识经验,或者通过运动镜像证实最初的知觉猜想是否正确,或者是词汇后加工的视觉化。因此,抽象概念加工中的情景模拟是句子加工后的句子情景的构建和比较。Glenberg和Robertson(1999)提出的索引假设(indexical hypothesis)更加关注运动模拟在概念表征中的作用,并且强调模拟是即时发生的,并非是词汇后加工的产物。该理论认为运动行为和句子理解享有共同的动作表征,句子理解通过建立句子暗示的动作模拟来完成,句子中的动允性(affordance)的提取是语言理解的重要过程,并用实验证明了动允性和阅读理解进程的相互影响关系。

Glenberg和Kaschak(2002)证实句子加工能促进动觉反应。实验要求被试阅读传递具体事物的句子(你给迈克一只笔)和传递抽象事物的句子(你给迈克讲故事),判断所读的句子是否合理,同时做出上臂靠近或远离身体的动作。实验任务中,一种情况下,判断反应的方向与句子所描述的动作方向一致;另一情况下,判断反应的方向与句子所描述的动作方向不一致。结果发现被试读前一半类型的句子比读后一半类型句子的反应快。Glenberg和Kaschak(2002)称此现象为动作一句子兼容效应(Action-Sentenee Compatibility Effect,ACE)。

Glenberg,Sato和Cattaneo(2008)的研究采用了短暂的身体训练技术,观察身体经验对句子理解的影响。实验要求被试将600个豆子从一个容器移到另一个容器中,移动方式包括远离身体的方向和靠近身体的方向两种。在随后的句子合理性判断任务中发现,不管句子描述的是抽象的物体转移事件或者是具体的物体转移事件,前期的物体转移动作都影响了句子的理解。

Boulenger,Hauk和Pulvermuller(2009)采用脑成像技术探索了惯用语(Idiom)理解中是否涉及运动信息激活。实验比较了被试阅读包含动作动词的惯用语(例如,“John grasped the idea")和表示实际动作发生的句子(“John grasped the object”)时产生的大脑激活差异。实验结果发现,两种句子都共同激活了被认为是语言加工区域的左侧额叶一颞叶网络。更为重要的是,两种句子都诱发了大脑运动区域的激活,并且这种激活产生在句子加工的末尾,而不是由单个词汇引发的。因此,该研究支持甚至在抽象的惯用语理解中,也存在感觉运动信息的激活。

虽然,Glenberg等提出的索引理论强调的运动模拟在一定程度上继承和发展了Gibson的动允性概念,并且来自动作句子兼容性的研究证据也从行为和神经机制两个水平为“具身认知”提供了有力证据,但是该理论过于强调运动模拟的动词语义诱发性,忽视整句背景信息的作用,因此也受到质疑。毕竟包含运动信息的句子非常有限。因此,对于确立语义具身性的地位来说,这些发现只能算是取得了有限的胜利(Goldman&de Vignement,2009)。

由上述可知,Barsalou和Glenberg都认同抽象概念表征的模拟机制,但Barsalou更关注抽象概念表征的整体情境模拟,其理论更具包容性。其不足在于,在说明哪些情境信息是模拟的要件时,说明并不清晰,所以其验证性不够。另外,由于整体情境模拟的发生,所以抽象概念的表征是镜像回顾的结果而并非即时自动的模拟结果,这在一定程度上说明Barsalou在解释抽象概念表征时,其理论观点已经不如其在解释具体概念时那样强势。Glenberg更关注运动模拟的共鸣机制,认为共鸣是即时发生的。运动模拟的共鸣机制具有很强的验证性,但是其证据主要还是来自句子理解,而句子中具有验证意义的动词的抽象性被普遍认为低于诸如“道德”概念的抽象性,所以如果要验证运动模拟的作用,还必须在更抽象领域得到证明。

3.2 具体经验和共同关系在抽象概念加工中的

作用

具体经验和抽象概念能否形成稳定的联系?当前存在两种对立的观点。其一,Gallese和Lakoff(2005)从神经活动层次认为,抽象概念与感觉运动信息之间可以形成稳定的联系。由于隐喻的经常使用,抽象概念与感觉信息之间形成了一对一的稳定联系,即具体经验和抽象概念之间存在稳定的联系。例如“Ideas are food”这个隐喻,由于人们经常使用这种表达,食物和主意之间形成稳定的联系。其二,Boroditsky(2000)提出的隐喻结构观(Metaphoric Structuring View)理论认为,隐喻的核心作用在于将从相对具体领域获得的关系结构引入抽象领域,而不是将表面特征植入抽象领域。根据隐喻结构理论,具体领域和抽象领域中共同关系维度的激活是联系概念意义和具体维度信息的关键。同样对于“Ideas are food”这个隐喻,食物和主意之间并不形成直接的联系,食物和饥饿与主意和智力需求之间的类比关系才是该隐喻表达形成的基础。这两种观点都得了各自实验证据的支持。

按照Gallese和Lakoff(2005)的观点,如果抽象概念与具体经验能够形成一对一的稳定联系,那么在抽象概念加工中,具体的感知经验信息能够得到自动激活。“隐喻一致效应”被视作支持该观点的关键证据,该效应指刺激呈现的空间位置与隐喻的映射方向一致,就能够促进抽象概念的表征和加_I。比如,Meier和Robinson(2004)发现当积极词(比如“快乐”)呈现在屏幕上方或者消极词(比如“悲伤”)呈现在屏幕底端时,被试表现出更快、更准的反应。他们认为,空间位置(“上”、“下”)与词的效价(valence)形成了稳定的联系,并能在词汇加工中自动激活。当抽象词隐喻的空间位置与词呈现的空间位置一致时促进被试反应,当二者不一致时干扰被试反应。随后很多研究者采用类似的范式发现,道德词、高权势词呈现在空间上方时,被试反应更快更准;消极情绪词、不道德词、低权势词呈现在空间下方时,被试更快更准(Meier,Robinson,&Caven,2008;Sherman&Clore,2009)。

上述关于隐喻一致性效应的研究发现,抽象概念隐喻的空间特性能够自动激活。该发现被认为支持了具体经验和抽象概念存在稳定联系的观点。然而也有研究指出,在抽象概念加工中,具体的感知经验并非是自动激活的,而是依赖于当前任务目的。比如Schubert(2005)对同时具有正性和负性属性的词(比如“独裁”)进行了研究。结果发现,在权力(具有权力的词或无权力的词)判断任务中,“独裁”呈现在屏幕上方时被试反应更快:在效价(积极词或消极词)判断任务中,“独裁”呈现在屏幕下方时被试反应更快。该结果说明,知觉经验与抽象概念之间的联系并非是稳定的,而是依赖于任务规则。

Lakens,Semin和Foroni(2011a)采用汉字翻译匹配任务范式,直接比较了稳定联系观点和共同关系观点对抽象概念加工的预测。实验中,同时呈现给被试黑色或者白色汉字与积极或者消极词组成的词对,让被试猜汉字和对应的翻译词是否匹配。结果发现汉字颜色和配对词意义一致时(比如,白色汉字和积极词或者黑色汉字与消极词一起呈现时),被试更容易判断二者匹配。实验同时发现,当汉字只以白色呈现时,颜色和词意一致性效应消失。这说明用白色来表征积极意义依赖于当前任务中黑色表征消极意义,即具体经验在抽象概念中的激活依赖于同时存在的共同关系。相似的研究发现,只呈现给被试表示高权力的词而不呈现表示低权力的词时,不管刺激出现的位置如何,均不能诱发隐喻一致性效应。该结果表明高权力词的空间表征需要在对比低权力词时才能产生(Lakens,Semin,&Foroni,2011b)。

此外,Boroditsky在“时间表征”方面的研究也表明,空间图式与抽象概念之间的联系并非是稳定的,而是高度灵活的。比如人们可以采取多种空间图式来表征时间,即可以采用自我移动或者物体移动的视角,也可以采用上下、左右、前后图式(Boroditsky,2000,2001;Casasanto&Boroditsky,2008),英语被试习惯于水平图式的信息来表征时间,而中文被试习惯用垂直图式来表征时间,并且当采取不同的图式训练后,相应的时间表征方式也会发生变化。

值得注意的是,支持索引假设的证据大多来自对物体、动作动词、含有动词的句子的研究,而隐喻结构观的证据大多来自“时间”等更加抽象领域的研究。而它们的抽象性应该是不同的。所以未来研究必须将抽象性进行更加细致的划分。

4 总结与展望

通过综述关于抽象概念的表征研究,我们发现,首先,大量的研究证据都支持了抽象概念与感知经验存在密切关联;其次,在感知经验是否是抽象概念加工的必要条件时,不同理论所支持的“具身”强度是不同的。隐喻表征理论认为,从感觉运动经验中获得图式,同时能够转换到缺少感觉运动经验的领域。隐喻表征理论的主要支持证据在时间领域,其他领域很有限,而通过时间隐喻得出的结论表明,空间经验虽然塑造了时间表征,但是空间经验并不必须在时间加工中得到激活,这一定程度上支持了抽象概念具有“低等强度”的具身性;知觉符号理论认为模拟并非是即时发生的,而是事后回顾性模拟,知觉符号理论也认为抽象概念的加工并不必然导致感知信息的激活,所以整体上讲,知觉符号理论认为抽象概念具有“中等强度”的具身性:索引假设理论的证据认为,抽象概念的理解依赖于运动的即时性模拟,其证据为来自动作句子兼容性效应的研究,其坚持认为运动模拟是抽象概念加工的必要条件,从这个方面看,其理论观点仍然代表“强势”的具身观。总之,这三种理论在抽象概念的“具身性”问题上,其理论代表的“具身强度”是不同的,而支持性证据“时间”、“道德”、“语言”确实存在不同程度的抽象性。如果从“认知发生在自身、环境(包括社会)中”的社会生态观点看,理论之间也并非不可融合。概念隐喻理论(包含隐喻表征理论和隐喻结构观)更加注重身体图式和语言文化的作用,而其关于“时间”的证据则表明了外部知觉(环境)和语言文化在抽象概念表征的作用:概念模拟理论(包含知觉符号理论和索引理论)在动作和情境模拟中的争论也反映了身体和环境在认知中的密切关系。总之,抽象概念与感知信息存在紧密联系,并且两种理论有融合的迹象。

在感知经验与抽象概念的联系机制上,概念模拟理论认为运动经验或内省信息是抽象概念获得的基础;而概念隐喻理论认为,具体经验和抽象概念之间的相似关系是抽象概念获得的基础,隐喻语言起着促进作用。而语言工具理论(Languagetool theory,Borghi&Cimatti,2010)认为语言学习、人际交流才是抽象概念获得的基础。但是,如何整合这些观点?我们认为在小心求证各种理论证据的同时,必须将身体状态、背景信息、动作、语言文化等因素纳入“具身理论”以期形成更为成熟的“具身”理论框架。同时,我们不能将概念表征看成稳定不变的心理实体,而必须从抽象概念的获得、存储和通达机制三个方面进行阐释。当前可以在以下两个方面进行探索:

即时通信基本概念篇7

[关键词] 变构模型;教学设计;学习科学;ALID模型

[中图分类号] G434 [文献标志码] A

[作者简介] 李海峰(1978—),男,河北唐山人。助教,硕士,主要从事教学系统化设计理论与方法研究。E-mail:。

一、引 言

“促进学生的学习”是教学设计的出发点和归宿,是集诸多教学要素系统化的目的。教学设计的设计基础是在析清“人类是如何学习”这一基本问题的基础上进行有效组织,通过对这一问题的理解和把握来进行学习内容、教师、学习者和媒体等教学要素的组织。关于学习含义的理解有诸多不同,主要分为如下几大学派:第一,以机能为主导的学习理论代表有爱德华·桑代克、伯勒斯·弗雷德里克·斯纳金、克拉克·伦纳德·赫尔等。桑代克倡导联结主义,通过选择和连接进行学习,学习是渐进的而不是顿悟的;斯纳金是激进行为主义的代表,通过应答行为与操作行为结合强化奖惩等措施进行教学研究;赫尔则通过探究驱力、线索、反应和强化来促进学生的学习。第二,以联想为主导的学习理论代表巴普洛夫,他认为学习的发生是通过条件反射而形成的,提出了预期学习理论观点。第三,以认知为主导的学习理论代表为皮亚杰、乔纳森,他们认为学习的发生基础是基于学习者原有知识,通过同化、顺应等进行知识的建构和发展。第四,以神经生理学为主导的学习理论代表为唐纳德·奥尔丁·赫布和罗伯特·C·波尔斯,他们从脑组织、神经网络和进化论的角度研究生物体与学习的相互影响及学习理论。[1]

从四大学习理论派别的发展来看,前两种学习流派过于机械化、简单化,忽视了人类的身心发展;认知学派较前两种理论有了较大的发展,但是同化、顺应的理论具有明显的局限性,而且很难由学习者自己独立发生;第四种学习理论从生物体的层面考虑了器官与学习的联系。然而安德烈·焦尔当认为,学习是从学习者的概念出发进行学习的,学习者的概念是他们用以理解的唯一工具;只有学习者本人才能转化他们自己的知识;学习者不能在没有他者存在的情况下学习。[2]这一观点的提出对于“什么是学习”和“如何促进学习”提出了新的视角,笔者结合这一学习理论探究了如何进行基于变构模型的信息化教学设计,并对该变构学习教学设计模型(Allosteric Learning Instructional Design ,ALID)进行了实证研究。

二、变构理论学习观

(一)变构理论隐喻

变构模型是学习科学视域下的一种新理念,是在分析和弥补从机能主义到认知主义缺陷的基础上,结合生物层面的理论而创造的一种新学习观,它源自生物中“变构蛋白”的特定结构和功能的一种隐喻。这些生物酶是生命的基础,其形态变化及由此而导致的功能变化取决于它赖以生存的环境条件。[3]这一隐喻得出了极具启发性价值的两个结论:首先,学习者的思想(即概念体)是由学习者能够启用和调动的关联决定的;其次,教育者只能通过操作教学环境等外部条件来干预学习者的概念体,从而促进他们的学习。

(二)变构理论学习观

变构模型的学习观主要包括以下几个命题:第一,学习就是转化学习者的概念。学习者的概念不仅是学习者学习的出发点,还是学习活动的结果,也是学习过程所使用的工具本身,学习就意味着从一种概念的结构状态进入到另一种概念的结构状态。[4]第二,概念体由五要素构成:P(问题)、C(参考框架)、O(心智运算)、R(语义网络)、S(意义符)。个体的一个概念总是首先对应一个质问,质问又与相应的(模糊性)问题而存在,概念的炼制通常使其得到明确,同时其他相互作用的四个参数对学习概念起着决定性的作用。第三,概念体既是学习者的工具,又是他们的“智力牢笼”。学习者只能利用自己的概念对信息进行处理、编码和解码;相反已存在的概念体会阻碍新概念的加入,尤其当新知识与已知概念相对质时,因为学习者认知、接受新概念时,总是用已有的概念进行解释,在这一解释过程中,难免会出现误解、对质,从而阻滞了对新知识的理解和认识。

三、变构学习教学设计(ALID)模型构建与依据

依据变构学习理论的基本观点和教学设计的理论基础,笔者提出并构建了变构学习教学设计模型。

(一)ALID模型构建的理论依据

变构学习理论认为,学习就是要使学习者原有的概念体发生变化,然而对于教师而言,学习者的概念体并不能人为地直接进行操控,只能像变构蛋白一样通过控制外部环境来影响和改变它。显然,基于变构模型理论的教学设计必须注意以下几点:第一,确定学习者的概念体,这是利用和对质概念体的前提,同时也是确定学习出发点的依据。第二,创设情境,旨在影响和变构概念体。概念体的变构分为直接建构和对质变构,即在特定的学习环境中,学习者可以通过自身的概念体进行同化和顺应新知识,但是大多数情况下概念体的变构是通过学习者与自身概念体的对质、解构和建构等不同阶段来实现概念体的重组的。学习环境的创设应充分利用现代媒体技术、人际互动等创设启动情境,激起学生的对质和动机。教学设计旨在使学习更有效、更高效、更吸引人。[5]主要包括分析、设计、制定、开发、实施、评价、修改教学问题解决方案的全过程,亦即应用系统方法对教学过程的诸要素、环节及其相互关系进行科学的分析、描述、计划或规定,为所需的教学活动制定具体可行、可操作的程序或方案。[6]变构理论教学设计模型旨在基于变构学习理论运用系统方法进行教学过程诸要素的组织与规划,为践行教学活动制定出具体可行、可操作的程序或方案。

(二)变构理论教学设计模型的内容

根据概念变构模型理论,并结合教学设计的相关理念构建了基于变构学习理论的教学设计模型(如图1所示),模型体现了概念体在学习者学习过程中的核心地位,突出学习环境对促进学习者概念体变构的重要作用。

基于变构理论的ALID模型包括分析阶段、解构与建构阶段和评价阶段三部分。分析阶段主要包括学习目标、学习者特征分析和确定学习起点。学习目标是学习结果的最终预期目的,也是教学工作者通过创设与操控学习环境欲使学习者的概念体发生变化的最终理想形态。学习目标的分析是利用学习者自身概念体的前提,也是与其对质的关键。学习目标的分析主要包括学习内容的组织形式以及与其相关的支持性概念,即既要理解学习内容,又要探究为学习内容与学习者概念体进行变构的支持性概念。学习者特征主要包括概念体、认知能力、学习风格和学习动机。学习者本身概念体的分析主要涉及概念体的五要素:P(问题)、C(参考框架)、O(心智运算)、R(语义网络)、S(意义符),获取学习者概念体的策略主要包括问卷、谈话、画图等形式。学习者的概念体是学习者对现实世界和所获信息进行解释的唯一工具,同时确定和把握学习者概念体是进行教学设计的前提之一,它关系到后续概念体变构的成败。认知能力和认知风格是进行个性化教学的基础,根据每个学习者的身心发展差异进行针对性的教学设计安排;学习动机主要分析学者当前对本学科内容的动机强弱以及原因。通过学习目标和学习者特征分析来确定学习起点,还应注意学习的起点是共性与个性的统一体,即将全体学习者的基本水平与单个学习者的个人起点水平对立统一起来。

变构模型学习理论最重要的环节就是解构和建构阶段。在这一阶段中,环境创设、资源设计和教学策略安排为学习者概念体的变构奠定了坚实的基础,同时也决定着概念体的变构成败。根据概念体的性质,即概念体的可利用性和障碍性进行不同教学形式的选择。如果学习者自身概念体能够直接同化和顺应外在知识,教师将会选择“利用”的教学流程;相反则会进入到概念体“对质”的教学流程之中。(1)“利用”模式。在“利用”教学模式中,学习得以顺利进行的前提条件是学习者已有概念体不存在错误,同时概念体的知识结构与学习内容的组织形态处于一致或类似的状态。此时可以通过创设启动环境激发学习者的动机,为学习者的概念体变构提供信息资源,并运用适当的教学策略提供逐步的帮助和指导来完成概念体的建构。在这一过程中,学习环境创建的成功与否直接影响着学习者原有概念体的变构;学习环境的创建必须与学习者原有概念体产生共振才能激发学习者的动机;学习环境的创建必须以学习内容为基础,为学习者原有概念体与学习内容的结合创设条件。(2)“对质”模式。这一模式应用的目的旨在排除、撼动、驳斥学习者原有概念体中的错误,将学习者的错误概念清除出去,要达到这一目的必须要和学习者的概念反着来。基于这种理论观点的学习环境创设,教师要制造导致思想对立的情境,这种对立可以是学生本身的,也可以是学生小组内部的。学习环境的创设要突出真实感、真切感和共振性,以最大限度地开发和利用各种学生真切感受到的认知冲突。教学策略由于对质的形式不同也存在着差异,在自我对质中,教师可以通过提供数据资料、实物接触、现实接触、实验观察等形式实现;在协作对质中,教师可通过组织辩论、小组讨论以及论坛、聊天室、博客、微博等形式展开。(3)评价阶段。动态性是评价的主要特征,因为在教学预设、进行中、结束等阶段,教师都在实时地进行监控与评价,同时采取相应的措施进行教学策略的调节。

四、基于ALID模型的实证研究

(一)研究设计

经过对学生教材的设计、实验对象的选取、资料的查找和研究的论证,在2012年2月确定了基于变构模型学习理论的实验研究过程,即基于ALID模型的应用研究实验。

1. 课题选取

研究的目的源于探索基于变构学习理论的教学设计及应用方法。实验方法为准实验研究法。实验对象源自七年级的教学班级,选取两个班级的生物学科进行实验研究,即实验班和控制班。实验班采用基于变构理论的教学设计模式,控制班采用传统教学模式,其他变量相同,同时对教材的教学预设分别进行了两种模式的教学设计开发,便于授课教师进行教学。

2. 建立假设与确定变量

研究假设:对于七年级的生物教学,基于变构理论教学设计模式的学习效果优于传统的教学模式。在这项假设中,条件因素C=学生进行七年级的生物课程学习;自变量X=两种教学模式(即变构理论的学习模式和传统教学模式);因变量Y=学生的生物学习效果;干扰变量为被试者的主观态度、习惯、动机、准备状态、目标定时,为避免或减少这些干扰因素对数据分析产生的影响,笔者每周一都进行课堂调研及时发现及时排解,并将其记录下来作为最终数据分析的参考。此外两个班级采用同一位教师、同样的媒体进行授课,避免这些差异影响最终数据的效度。

3. 选取实验对象

首先对河北省遵化市地北头镇中学的七年级所有班级进行传统教学模式的生物教学,在第八周时进行七年级所有班级的生物测试,这次测试以第八周的月考试题作为对学生生物学习效果的前测;接着对各班进行生物成绩平均分和方差齐同性的分析,并检查他们的成绩是否服从正态分布或接近正态分布。通过筛选最终确定了两个班级,分别是七(1)班为实验班和七(2)班为控制班。

4. 教材内容设计

教师讲授的教材为七年级下册的《生物》,前八周采用传统的教学模式,在第八周后对七(1)班采用基于变构模型的教学模式进行教学设计,对七(2)班继续延续前八周的教学设计形式。基于变构理论的教学模式强调学习环境的设计,并运用学习环境来影响和促进学生的学习,如与现实对质、与同伴对质、与自己对质等,学习环境的设计仅仅围绕P(问题)、C(参考框架)、O(心智运算)、R(语义网络)、S(意义符)这些概念体的要素进行。教师通过获取学习者概念体,然后创设环境来解构和变构学习者的概念体,基于这一理念进行教学内容的设计与组织。

(二)实验结果

实验研究所采用的数据分析软件是IBM SPSS Statistics 18,分析数据包括两个实验组学习者的前测和后测成绩。

1. 前测成绩比较

对两个实验组学习者的前测成绩进行独立样本T检验,检验结果显示:实验班的前测平均成绩为79.37,控制班的前测平均成绩为79.28。两个实验班的前测成绩比较结果表明,实验班与控制班前测成绩差异显著性概率P=0.973>0.05,故两者不存在显著性差异。

2. 后测成绩比较

对两个实验组学习者的后测成绩进行独立样本T检验,通过F=0.072和P=0.791可以确定,两个实验组的方差具有齐性,不必进行置信度的区间调整。检验结果显示:实验班的后测平均成绩为89.29,控制班的后测平均成绩为80.21。两个实验班的后测成绩比较结果表明,实验班比控制班的平均成绩高9.08,实验班与控制班后测成绩差异显著性概率P=0.013

(三)实验讨论与案例剖析

基于变构理论教学模式进行的生物教学效果明显优于传统教学的学习形式,这表明该学习理论能够有效地促进学生学习。在实验教学的研究过程中,基于变构理论的教学过程是一个复杂、互动的过程,笔者从变构理论视角出发,基于ALID模型围绕四个维度详细论述如何在实践中进行教学设计及其关键点,并例举相关案例进行解读。

1. 概念体的获取与确定

概念体是变构模型的核心观念,因为概念体是学习者认识、理解外界的唯一工具,是新知识的解释系统,没有相关概念体的存在学习将无从谈起。显然,确定学习者的概念体是教学得以成功实施的前提,是教学设计的前提。在教学中,通常采用问卷、谈话、画图、文字描述、录音和视频等手段获取关于学习者的概念体。问卷法适合学期开学时的测评,如果在每一节课开始时都进行测试会对学习时间的分配造成影响,同时测评的结果并不能及时准确分析,也不能及时确定教学内容和策略。谈话法也可称为问答法,即在上课或在教学过程中随时通过问答的形式获取学习者的概念体,这种方式灵活、多变,但是教师所询问的问题并不能完全揭示出学习者与学习内容相关的全部概念体,因为这些内容往往是教师所关注的,通常带有主观性,这一局限性容易忽视学习者起支持作用的概念体,为以后概念体的成功解构和建构产生负面影响。画图法是学生概念体自我表征的一种有效形式,与文字描述方法相结合效果更为突出。在时间充裕的情况下,学习者能够尽显其所掌握的全部相关概念。因此教师可以规定让学生通过概念图、思维导图等形式来描述概念体,这种方式可以弥补谈话法、问卷法所隐含的教师主观性缺陷。录音和视频手段能够实时记录学习者概念表达的任何瞬间,为研究者留有足够的时间去深入研究他们概念体表达的内容、形式。研究表明,学习者概念体的表述并不是一件易事,需要根据内容进行环境设计,即创造激发性的启动环境,激发学习者的动机,使学习者愿意、积极地尽显相关的概念体。

在《血液循环系统》一课的教学中,教师首先通过谈话、填图的形式对学习者关于血液循环体统的概念知识进行测试,通过测试可以明确学习者概念体中的错误概念、空缺概念,为变构他们的概念体做好充分准备。通过测试表明,学习者对血液循环的方向存在着明显的错误认识,把握住学生概念体的这些问题关键点,将有利于进行学习环境、学习策略、学习工具的设计与提供。

2. 通过概念体进行学习

学生是从他的概念出发进行学习的,学习者的概念是他们用以理解的唯一工具。学习过程本质上就在于学习者究竟如何解决本身概念体与学习内容的差距问题,即学习者如何在已有概念体的基础上进行对差距内容的编码和解码。利用概念体学习的前提条件是必须理解已有概念体的特征参数,即问题、参考框架、心智运算、意义符和语义网。研究表明,学习者对外界进行解释、编码的过程实际是不断对自己已有概念体进行质疑的过程。例如学生在对人的血液循环系统进行学习时,会不断提出一系列问题,“肺循环的过程是怎样的”、“左心房、左心室和右心房、右心室的血液是如何循环的”、“心脏和肺循环的关系和影响怎样”等。提问的同时,学生通过心智运算会在自己已有的概念体中迅速地搜寻参考框架、意义符,探索所有相关的语义网络。在这一过程中需要注意一个关键问题,也是确保教学成功的关键环节,即在确定学习者已有概念体之后必须对其进行相关参数进行分析,防止学习内容超出学生的“最近发展区”或承载能力。进行教学设计需要注意的是学习内容与学习者概念体的参考系数的一致性或相似性,即教师是否是在分析了概念体已有网络结构的基础上进行学习内容的组织与安排的,是否存在着与新授内容相关的参考框架。简言之,是否能够利用已有概念体将新知识纳入到学习者的概念结构中。研究表明,通过概念体进行学习的有效策略包括补充思维导图和概念图、虚拟实验解剖、接触实物等。补充思维导图和概念图旨在引导学生完成从已有概念体到学习内容之间差距的概念结构,这是一种非常有效的同化和顺应方式;此外通过虚拟实验、实物接触、媒体等手段能够解决学习者提出的各种质问,即通过学习者的观察、探索、质疑进行学习者概念的建构和解构。在《血液循环系统》教学中,通过向学生提供血液循环的半成品概念图,即空缺其中重要的位置和方向,让学生根据已有的知识进行填充和通过资料进行查询。

3. 对质与概念体

学习绝对不是累加式的机制,而且只有在一些特殊情况下才可能实现同化和顺应,更多的情况则是突破学生原有概念的“智力牢笼”,与原有概念体对着干。学习者的概念体是对现实和所接受信息进行解码的唯一工具,不能完全被移除,然而教学设计者必须通过分析学习者已有的概念体确定其中的错误之处(即教学设计就是要通过学习环境设计来影响和对质这些概念),最终通过解构和重构实现学习目标。研究表明与学习者原有观念进行对质是一件十分困难的事情,有一部分学生由于害怕自己认为正确的观点得到质疑、挑战而常常处于默不作声或置之不理;有一部分学生在小组讨论对质时情绪异常激动,他们为了维护自己的观点时常争论得面红耳赤,有时甚至走到了理智的边缘,这完全源于自尊心和对自己观点的坚持。学习者原有概念体的改变并不会易如反掌,一方面来自于学习者情感方面的维持,另一方面来自于与之保持较强一致性的概念体网络,只有当学习者的概念体完全无力维持他的观点并且认识到确凿的事实时,才会放弃原有观点,并通过解构和建构来接受新知识,新知识也只有在先拥知识失效的情况下才会真正安置下来。在《血液循环系统》教学中,采用小组讨论与班级答辩相结合的形式进行对质活动,即组内自我对质、小组对质和全班的人际交流。在对质过程中,学生对具有怀疑的问题表现出较高的兴趣。教师应实时监控小组和班级学生的讨论状态,如果发现某个小组兴趣较低,应及时通过设疑、制造矛盾等方式挑起学生的对质热情。

实验表明,与学习者的概念体进行对质的有效策略包括实物与现实接触、自我表述与评析、辩论等。最有效、最直接的莫过于通过实物的接触来驳斥学习者已有概念体的错误,这种对质是学习者通过实物真实感触的自我对质,比较温和且易于接受。此类方法也可以通过多媒体手段实现。自我表述与评析是通过学习者不断进行自我质疑实现的,但这种方式对于改变学习者的概念体效果并不明显。因为学习者很难挑战自己的错误概念,然而这种弊端可以通过设计基于资源的学习模式来实现,学习者通过对自己的质疑和资源搜索不断地解构错误观点,同时建构正确的概念体。辩论是一种较为强烈的对质,辩论的双方或个体会调用所有与其观点相关的论据来驳倒对方。这一过程既是对学习者原有概念体网络结构稳定性、正确性的检验,同时也是验证概念体对于事实完整性、稳定性的一种方式。当学习者已有概念体不能解释对方质疑或者所提出的概念被对方反驳成功时,这时就会引起概念体的“空位”和“认知冲突”,因此学习者不得不重新审视自己的概念体,通过解构和建构实行概念体的变化。辩论是激烈的、痛苦的,但是对于学习者的概念变构是印象深刻的。在教学过程中,教师需要根据辩论的激烈程度进行辩论过程的控制和调节,避免辩论过于激烈或平淡。为了避免面对面辩论过于激烈,可以借助现代技术手段通过聊天室、论坛、微博、博客和其他即时通信工具进行中性辩解。

4. 学习环境与概念体

教师或教学工作者不能直接操纵学习者内在的概念,只能通过外在的学习环境设计来影响学习者的概念体。学习环境在学习者的概念变构过程中具有重要的作用。首先,需要创设有效的学习环境以展现学习者的概念体,获取和确定概念体的结构组织,为变构学习者内在概念体提供依据。其次,为与学习者原有概念体的对质创设学习环境,主要通过实践参与、实物接触、媒体虚拟等手段为自我对质、展开辩论提供有效的支持。学习环境设计的切入点不仅仅在于概念体中的要素,而在于要素之间的组织关系,学习环境要针对不稳定的观念要素联系或错误概念及其联系创设一种不协调的外在情境,启动学习者自我质疑,寻求答案的动机。第三,学习环境应为学习者不同变构过程提供适当的信息支持,包括在概念体的表达阶段和变构阶段。在表达阶段主要以问答、填图与画图等形式进行设计,这些形式可以通过多媒体形式来实现。在变构阶段主要通过实物提供、现实接触、数字媒体资源来实现,旨在为利用学习者概念体或对质学习者的概念体提供事实参照,促进概念变构效率。根据《血液循环系统》一课的特点,主要采用了基于网站的信息化学习环境设计,网站的内容包括血液循环系统的Flas、在线聊天室等这几项功能,目的在于向学习者提供自我对质、群组对质的条件,促进学习者识别已有概念体,变构错误概念体,建构新的概念体。

五、结 语

通过ALID模型的提出、构建与实证研究,旨在从变构学习理论的维度探索学习的发生机制和如何通过教学设计促进学生的学习。在变构模型的教学设计中最为重要的一点是获取、确定学习者原有概念体,这是学习者概念变构的前提;同时学习环境的设计是基于学习者原有概念体和学习内容的基础上进行设计和开发的。在对概念体的理解上一定要把握其双重身份,即可利用性和矛盾性,根据其不同的特性进行环境、资源和教学策略的设计。ALID模型是通过一学期的生物教学实验并结合概念变构学习理论的基础上得出来的,其局限性在于不同学科的性质造成对学习环境设计、资源安排和教学策略的差异性需求,这也是以后需要进一步探讨和研究的。

[参考文献]

[1] B.R.赫根汉.学习理论导论[M].上海:上海教育出版社,2011.

[2] [4] 安德烈·焦尔当,菲新宁.变构模型[M].北京:教育科学出版社,2010.

[3] 裴新宁. 学习究竟是什么[J].全球教育展望,2008,(6):13~20.

即时通信基本概念篇8

关键词:语义检索;概念语义树;语义相似度

中图分类号:TP391 文献标识码:A 文章编号:1009-3044(2011)16-3809-02

Research on Method of Semantic Similarity Based on Concept Semantic Tree

HAN Xin, QIN Fan

(School of Electronics and Computer Science and Technology, North University of China, Taiyuan 030051, China)

Abstract: At present, the application of information retrieval has been widely used, but it is still a difficult thing to be accurate in the specific field of searching. This paper provides a semantic similarity calculation method based on the concept semantic tree, considering the concept of the semantic relations, hierarchies, and inheritance and other factors, as much as possible to improve retrieval efficiency in specific areas of information, and at final, demonstrate the feasibility of the method by experiment.

Key words: semantic retrieval; concept semantic tree; semantic similarity

传统的信息检索都是基于关键词查询的,因此在检索时可能会出现一堆用户并不真正需要的信息,导致查询结果的准确率很低,查全率也不令人满意,会出现“表达差异”,“词汇孤岛”等问题。语义检索就是把信息检索从传统的基于关键词层面提高到基于语义的层面,从语义方面着手,分析概念之间的内在联系,利用语义来组织、存储和获取信息,信息和语义的结合,使信息变成计算机可识别的知识,从而系统能识别出用户所需要的信息,提高检索的查准率和查全率。

1 语义相似度

语义相似度是对语义相似性的定量表示,语义相似度计算是信息检索、数据挖掘、知识管理等领域的基本问题。在信息检索中,语义相似度能够更多的反映文本概念是否符合用户的查询要求,相似度越高,说明文本内容与用户的查询请求越接近。

刘群、李素建[1]基于实例的机器翻译,提出语义相似度就是两个不同上下文本中的本体概念,在不改变文本的句法及语义结构的情况下可以互相替换的程度。如果位于不同上下文本中的两个概念词语在不改变文本的句法及语义结构的情况下可以互相替换的可能性越大,则说明二者的相似度就越高,否则相似度就越低。

当两个语义概念元素x,y相似时,用sim(x, y)表示两者之间的相似度,形式上,相似度计算满足[2]:

1)相似度的值为[0,1]区间中的一个实数,即sim(x, y)∈[0,1];

2)如果两个对象是完全相似的,则相似度为1,即sim(x, y) = 1 当且仅当x = y;

3)如果两个对象没有任何共同特征,那么相似度为0 ,即sim(x, y) = 0;

4)相似关系是对称的,即sim(x, y) = sim(y, x)。

2 概念语义树

使用层次化的树状结构来描述概念之间的逻辑关系,这种语义化的概念树为检索算法提供语义基础,在检索过程中不同的概念之间也有一定的相似性和相关性,因此需要处理概念树中祖孙节点、兄弟节点等不同类型的关系,我们考虑用概念间的相似度对其进行描述和量化,以提高检索的准确率为了计算概念相似度,作如下定义[3-4]:

定义1:在本体概念的树状层次结构中,如果概念A和概念B之间存在这样的关系:A是B的祖先,则称A和B为同支概念。概念A称为A和B的最近根概念,记为R(A,B),而A、B之间的距离dist(A,B)=dep(B)-dep(A),其中depth(C)为概念C在层次结构中的深度。如图1(a)所示。

定义2:在本体概念的树状层次结构中,如果概念A和概念B之间存在如下这样的关系:A不是B的祖先并且B也不是A的祖先,则称A和B为异支概念。如果概念R是A和B最近的共同祖先,并且是符合此条件的所有节点中距离概念树的根节点最远的一个,则称R为A和B的最近根概念,记为R(A,B),且A、B之间的距离为dist(A,B)=dist(B,R)+dist(A,R),如图1(b)所示。

定义3:概念C 称为概念A 和B 的语义相关概念,当且仅当概念C 满足如下的条件:当A, B 为同支概念时,C 在以A 为根的子树中且不在以B 为根的子树中;当A,B 为异支概念时,C 在以R 为根的子树中且不在以A 或B 为根的子树中。

在计算语义相似度时,A和B各自的子概念数以及它们的语义相关概念数对相似度计算结果也有影响, 当A,B为同支概念时,A的子概念由B的子概念和A,B的语义相关概念组成,前者所占的比重越大,则概念A,B的语义相似度越大;当A,B为异支概念时,R的子概念由A 的子概念、B 的子概念以及A,B 的语义相关概念三部分组成,前两部分的比重越大,则A,B 的语义相似度越大。

1)当A,B为同支概念时,A与B之间的语义关系为:

式中,m表示概念B的子概念数,n表示概念A的子概念数。

2)当A,B为异支概念时,A与B之间的语义关系为:

式中,m表示概念B的子概念数,n表示概念A的子概念数,X表示A与B最近根概念的子概念数。

定义4:两个概念之间的语义距离,是指在语义树中连接这两个概念的最短路径的长度。语言学研究认为,两个概念的语义距离越大,其相似度越低;反之,两个概念的语义距离越小,其相似度越大,两者之间可以建立一种简单的对应关系。特别地当两个概念之间语义距离为0 时,其相似度为1;当两个概念之间的语义距离为无穷大时,其相似度为0。两个概念之间的语义距离表达式为:

式中,distant(A,B)表示概念A与B之间的语义距离,weighti表示连接A,B的最短路径上第i 条边的权值。

定义5:概念的深度是指该概念与语义树根的最短路径中所包括的边数。因为在语义树中,每一层的概念都是对上一层概念的细化,由此可见,在语义距离相同的前提下,两个概念的深度和越大,概念之间的相似度越大;两个节概念的深度差越小;概念之间的相似度越大。概念深度的表达式为:

式中,depth(A)表示概念A的深度,n表示概念A与语义树根之间的最短路径中所包括的边数。

3 语义相似度计算方法

考虑概念语义树中概念之间的层次关系、继承关系及语义关系,我们提出下面这个关于语义相似度的就算方法:

其中:Level(A,B)表示概念之间的语义关系对相似度的影响;

Distant(A,B)表示概念之间的语义距离对相似度的影响;

Depth(A,B)表示概念之间的深度对相似度的影响。

但对概念语义树中层次结构分以下这两种情况考虑:

1)当A,B为同支概念时,A与B的语义相似度为:

2)当A,B为异支概念时,A与B的语义相似度为:

α,β,γ为调节因子,且α+β+γ=1.

4 实验结果

选取如图2一个简单的实例来计算语义相似度。

选参数α=0.6,β=0.3,γ=0.1,可得到“计算机”与其余各节点之间的语义相似度为:

参考文献:

[1] 刘群,李素建.基于《知网》的词汇语义相似度计算[J].Computational Linguistics Chinese Language Processing,2002,7(2):59-76.

[2] 李玲.面向流程诊断的企业知识相似度匹配工具研究与开发[D].哈尔滨:哈尔滨工业大学,2006.

[3] 王进,陈恩红,施德明,等.一种基于语义相似度的信息检索方法[J].模式识别与人工智能,2006(6):2-6.

即时通信基本概念篇9

【关键词】数据库;选课系统;设计

随着计算机技术的飞速发展,高校也已进入信息化时代。随着在校大学生人数的不断增加,为了使高校管理更高校、更科学,目前大多数高校都采用网上选课系统。教务系统的数据量也不断的上涨,校园数字化建设不断的发展,学生选课管理的信息化成为学校教学资源开发和管理的重要手段,从而有效处理网上选课的管理工作,实现师对网上选课信息管理的自动化,提高管理校率。

一、数据库的需求分析

选课系统能够对教师、学生和课程信息的进行有效的管理;对学生的选课和课程成绩的管理等环节进行信息化管理;实现学生网上选课,网上查看课程成绩的可能;在该系统中使得教师、学生和课程这三者之间形成有效互动。

选课系统采用B/S结构模式开发,系统主要功能包括:用户息管理,教师管理、学生管理以及课程管理,功能模块结构图如图1所示。

图1 网站功能结构图

二、数据库概念设计

数据库设计主要是进行数据库的概念设计。概念模型是数据库系统的核心和基础,通过概念设计得到的概念模型是从现实世界的角度对所要解决的问题的描述,不依赖于具体的硬件环境和DBMS,把用户的信息要求统一到一个整体概念结构中,此结构能表达用户的要求。概念设计阶段,一般使用语义数据模型描述概念模型。通常是使用E-R模型图作为概念设计的描述工具进行设计。使用PowerDesigner设计E-R模型图就可以得到数据库的CDM(概念数据模型)图,图2是选课系统的CDM图。

图2 选课系统数据库CDM图

其中,学生实体的属性为:学号、姓名等,学号为主码;教师实体的属性为:工号、姓名等,工号为主码;课程实体属性为:课程编号、课程名称和学分等,课程编号为主码。实体之间的逻辑关系分别为:学生实体和课程实体是多对多的关系,教师实体和课程实体是多对多的关系,学生实体和教师实体通过课程建立关系的,因此不需要直接建立关系。

数据库概念设计完成后进行逻辑设计,逻辑设计主要工作是将现实世界的概念数据模型设计成数据库的一种逻辑模式,即适应于某种特定数据库管理系统所支持的逻辑数据模式。可以使用PowerDesigner的“Generate Physical Data Model”工具将CDM图转换成PDM图(即逻辑设计图)。

三、数据库实施与维护

选课系统数据库的物理设计即利用PDM生成的SQL脚本在DBMS中执行,可以得到数据库的框架结构。

数据库的维护包括内容有:数据库管理:提供库存查询信息。

数据库管理员能够提供学生、教师和课程基本信息;学生、教师和课程管理:教师编辑课程和学生选课操作;成绩管理:成绩的查看、修改以及统计。

用户管理:用户基本资料查看,用户的添加和删除。

四、结束语

网上书店数据库的设计主要是围绕着图书电子商务的业务活动而展开的,一个好的网上书店数据库设计通过一系列的设计步骤逐步深入,也为更好的设计网上书店网站系统提供一个良好的数据基础。

参考文献

[1]王立新,章曙光.数据库原理的案例导向教学研究[J].电脑知识与技术,2010(22).

即时通信基本概念篇10

[关键词]数字图书馆 领域本体 用户兴趣模型

[分类号]G253

目前,数字图书馆正在向为用户提供个性化服务发展。通过研究,我们发现个性化服务的质量往往取决于图书推荐技术、检索技术。因此建立用户兴趣模型,是整个个性化服务系统建设的关键。建立用户兴趣模型的实质是将潜在的用户需求用显性的方式表达出来,并借用计算机技术和信息处理技术,由系统对用户服务进行维护、管理。

基于本体的用户个性化服务是一种借助领域本体,通过自动保存用户查询历史记录文件,运用所构建的用户兴趣模型对本体构建用户需求和服务资源内容进行匹配的机制。

1 本体及其构建的相关理论基础

本体概念来源自哲学学科,主要用来揭示事物的本质,是“共享概念模型的明确的形式化规范说明”。本体不仅能够准确描述某一概念的内涵、外延及其内在联系,还可以通过逻辑推理进行语义表达。作为能在语义和知识层面上进行概念描述的工具,本体在知识工程以及图书情报等领域得到了较多的实践和应用。

本体作为知识的一种组织方式,既定义了组成该领域词汇表的基本概念和相互关系,又定义了这些关系外延的规则,能够真实地反映事物本质。具体而言,本体就是由一个词汇术语和推理规则所组成的规范组合。

1.1 本体的定义

本体从形式上定义了领域内相关概念间的关系,通过对概念、术语及其相互关系的描述,显现某一领域的知识体系,将概念层次结构和逻辑推理融为一体。

本体是由六元组集合0{C,Ac,R,AR,H,X}组成,其中c是概念集合,Ac是属性集,R是关系集,AR是关系属性集,H是概念层次,x是公理集。其中,cj表示某一领域内相同类型对象的集合,可以由A。(ci)的属性集来进行描述;r;(cp,cq)则表达概念cp和cq之间的相互关系,rj的属性由A“(ri)来表达;H是从集合c中抽取的概念结构,属于c中概念的超类/子类关系集合。

1.2 确定本体的领域与范围

构建领域本体,首先要明确其覆盖的领域和范围,并且,本体的目标、作用和其系统开发、维护以及应用的对象,这些元素对领域本体的建立有很大的关联性,所以应当在构建领域本体前引起注意。此外,能力问题是由基于该本体的知识系统可以回答的一系列问题所组成,通常被用来检验该本体是否满足领域需求,包括:该本体能否拥有足够的信息来回答这些能力问题?而这些问题的答案是否需要特定的领域表示?在领域本体创建的开始阶段,需要我们尽可能列举出该系统的所有概念。

1.3 建立领域本体库

领域本体库是用于描述指定领域知识体系的一种专业性本体,它包括:该领域本体概念及各概念间的相互关系、领域行为以及所属特性和发生规律的一种显性化描述。领域本体确定了该领域内普遍认同的确切概念,通过对概念之间的关系进行语义描述,使用户与机器之间的交流既可以通过语法层次,又可以使用语义层次进行。因此,将领域本体应用到信息过滤的程序中,可以弥补传统信息过滤技术的缺陷。

领域本体库是一个在某领域内的概念层次结构集合,这些概念既可以自己创新,也可以借用已有的主题或词义库。就数字图书馆领域来讲,目前的一些图书馆网站提供了自助创建的在线层次主题,每个主题对应着一系列相关的页面供个性化用户浏览,这种形式为本文构建数字图书馆动态用户兴趣模型提供了借鉴。

2 构建数字图书馆领域本体个性化服务

2.1 建立本体框架

基于领域本体所产生的概念集,需要按照特定的逻辑规则对这些词汇进行重新组合,形成各自不同的领域,而对于同一领域的词汇概念而言,其相互之间的关联性应该较大。

另外,还需要对各个领域中每一个概念的重要性进行科学评估,遴选出关键术语,剔除掉那些不必要的或相关性较低的概念,用准确而精简的概念词汇来表达该领域的知识体系结构。至此,则形成了该领域知识的概念框架体系,也就是领域本体的框架结构。

根据这一原理和要求,数字图书馆领域本体框架包括:用户、资源库、查询处理、检索等。

2.2 设计元本体

为了描述领域本体的框架结构中的各个概念,需要运用术语对各个概念进行一一标识,并对各个概念的内涵和外延进行确切定义。因此,本文设计元本体来定义概念。对于某个概念,我们既可以选择使用元本体中定义的元概念来定义,也可以选择在本体中已经有定义的概念进行再定义,还可以重新使用已有的本体。

元本体是本体的本体,是用于定义本体的概念,例如:实物、关系、角色、行为等。元本体可以理解为更高层次的本体,是领域本体内概念的抽象表达。

目前,网络上有许多可以使用的本体词汇资源库。使用已有的本体,既可以减少开发的成本,又能增强与其他系统的交互能力。目前来讲,对于数字图书馆,有许多本体都可以通过网络获得。除了定义概念,还要定义概念之间的逻辑关系。而这些逻辑关系不仅要涉及同一工作领域的概念,还可以表达相关工作领域的概念,而所有这些关系都隶属于同一个工作领域。

而在自行创建的概念中,很大一部分属于类,目前来讲,对于类层次的定义主要有以下3种方法:①自上向下法:即先定义领域中那些综合的、概括性强的概念,然后再逐步分解细化说明;②自下向上法:先定义具体的、例外的概念,从定义最底层、最细微类的定义开始,然后再利用这些定义对综合性的概念进行解释;③混合法:即自上向下法与自下向上法混合使用,先建立那些常见的、普遍的概念,然后分别向上泛化与向下细化。

以下,本文将综合运用这三种方法,建立数字图书馆领域本体的动态服务模型。

2.3 动态用户兴趣模型的个性化服务框架

对于数字图书馆这个本体领域来讲,提供基于动态用户兴趣模型的个性化检索服务,需要综合利用搜索技术、查询技术以及用户兴趣调查,寻求满足用户动态需求的最佳结果。建立动态用户兴趣模型在个性化检索中的作用是:在用户发出检索要求时,这些信息被采集用来创建动态用户兴趣模型的基础数据,当动态用户兴趣模型和查询要求一起传输到服务器的时候,向搜索引擎提交查询请求,搜索引擎经过对本体集合的匹配,返回相应的检索结果。检索结果是依据用户的搜索要求内容与动态用户兴趣模型的相似度进行匹配,匹配处理的结果就是返回给用户的选项。基于数字图书馆领域本体的个性化检索服务模型如图1所示:

在基于数字图书馆领域本体的个性化检索服务框架中,个性化搜索推荐的原理是利用用户兴趣模型寻找与之匹配的资源,或寻找具有相近要求的用户群,互相推荐浏览信息。服务器通过动态收集用户的信息要

求和兴趣,自动应用用户兴趣模型,向用户推荐合适的信息资源,并能根据用户的反馈进一步改进推荐。基于领域本体的数字图书馆个性化服务正是依据本体表达的用户兴趣概念,发现与用户要求相关的资源信息,作为结果推荐给用户以及具有相似要求的用户。基于领域本体的个性化服务的推荐框架如图2所示:

其中,信息发现是通过运用元搜索引擎技术,根据用户兴趣模型本体库所表达的用户要求信息,从资源信息库中检索出与用户要求相匹配的资料;信息过滤则是通过用户兴趣模型,在领域本体库的范围内,对检索结果进行过滤处理;处理后的结果就可以通过智能推送给用户,同时通过发现相似用户,把这一检索结果推送给具有相似兴趣的用户,实现协同推荐;最后,根据用户的评价和反馈修正用户模型本体库。

3 基于领域本体的动态用户兴趣模型构建

完整构建一个动态用户兴趣模型的过程主要包括以下内容和环节:获取用户兴趣和检索要求信息、分类用户兴趣和检索要求信息、匹配用户兴趣模型、发送检索结果和动态更新用户兴趣模型等任务。其中,获取用户兴趣和检索要求信息的过程为动态用户兴趣模型的建立提供必要的数据信息资源;用户兴趣信息分类则是将用户兴趣信息按照不同的维度进行分类,得出用户的主题兴趣;匹配用户兴趣模型是将用户兴趣信息与已有的领域本体库进行匹配,以获得动态用户兴趣模型;用户兴趣模型的动态修正就是根据用户不断变化的需求更新用户的兴趣数据库。

3.1 用户兴趣信息的获取与分类

在数字图书馆的服务中提供个性化信息服务,首先要解决的问题是如何从用户浏览网页的数据信息中提取出用户的主题兴趣信息,即通过收集查看用户的浏览行为来确定用户的兴趣主题。常见的用户兴趣主题的收集方法主要有显式方法和隐式方法。显示方法是用户在数字图书馆的网页上选择符合自己兴趣的信息,可以确切地反映用户需求所在。隐式方法是指整个用户兴趣发现的过程都不直接由用户提供,而是通过数字图书馆管理系统自动获取用户的兴趣信息资料,经过专业工具分析处理后,输出到用户的动态兴趣模型。由于用户兴趣具有很强的时间性和动态性,本文采用隐式方法来获取用户兴趣信息资料。

通过隐性方法获取用户兴趣信息数据的途径很多,包括计算机日志信息、用户访问行为数据、访问页面的链接信息、访问内容、访问时间、下载行为、书签标记情况等。这些用户活动信息资料存储在用户缓存文件夹中,包括用户在检索查阅时间内的所有兴趣数据。然后将这些内容通过归一化、特征向量提取和特征权值计算等过程,用内容向量空间表示其内容分类。

3.2 基于领域本体的用户兴趣信息匹配

用户兴趣信息匹配过程就是通过计算信息内容的向量,计算该结果与领域本体库中概念向量之间的相似度。向量间的相似度计算公式常用内积运算,但是由于领域本体的用户信息兴趣内容文档的长度不一,尤其是长文档具有高词频特点,所以在进行匹配的过程中,需要对长文档进行规范化处理,排除长文档比短文档具有的优势。余弦规范化是同时针对长文档的两个特点进行归一化处理,这也是向量空间模型中最为常用的一种处理方法。

同时,还需要考虑的是访问时间和页面长度。如果用户在一个页面上停留了较长时间,则对这个页面的兴趣值应增加。然而,如果页面长度很长,则时间因素的影响效果应降低。

3.3 用户兴趣模型的构建

根据计算出来的文档向量与领域本体库概念向量的相似度大小,页面被分类到相似度最大的概念下。初始状态下,领域本体库下的所有概念的权重都是0,随着访问的页面不断被分类到领域本体库中相应的概念下,概念权重得以标注和不断累积,产生一个最初的用户兴趣模型。概念的权重代表用户的兴趣分数,权重越高表明用户对该概念的兴趣越大。

3.4 用户兴趣模型的动态更新

为了更好地满足数字图书馆用户的动态、个性化服务需求,需要对用户兴趣模型进行及时更新修正。一般来讲,最初的用户兴趣模型需要根据用户行为的变化而进行更新和维护。随着用户与数字图书馆管理信息系统的不断匹配,用户不断选择新的文档,新的文档又不断被分到相应的类概念下,这时就可以通过扩展激活模块来更新动态用户兴趣模型中的概念兴趣分值。兴趣分值根据激活值进行更新。同时根据实际需要踢掉兴趣分值低的概念,添加用户兴趣分值高的概念。由此,基于领域本体的数字图书馆动态用户兴趣模型框架如图3所示:

由图3可见,本文所提出的动态用户兴趣模型实质上是一个带有概念权重的领域本体实例,是领域本体库的子部分,其构建综合运用了本体和向量空间模型的原理。因此动态用户兴趣模型的描述是基于本体的表示方法和基于向量空间模型表示方法的综合应用。利用本体概念表示用户的兴趣节点,利用概念分数表示用户对此概念的兴趣度。由此动态用户兴趣模型可以由一个三元组来表示:{c,,c:,…,c,}={(c1,w1,T1),(c2,w2,T2),…,(ci,wi,Li)}。

其中,c;为用户的第i个情景概念,(Ci,wi,Ti)为第一个概念的描述,w;为第i个概念的兴趣权重,Ti为第i个概念权重最近一次更新时间。动态用户兴趣模型构建完成之后,其所蕴含的用户兴趣信息就可以用于一系列的信息检索活动中,包括个性化的搜索、浏览、过滤等。