科学计数法的规则范文

时间:2023-08-12 09:27:35

导语:如何才能写好一篇科学计数法的规则,这就需要搜集整理更多的资料和文献,欢迎阅读由公务员之家整理的十篇范文,供你借鉴。

科学计数法的规则

篇1

关键词:统计调查;数据质量;控制标准

中图分类号:C8 文献标识码: A

一、调查过程中数据质量控制的基本原则

1、科学

统计查询的科学化是进步查询数据质量的核心。在实践过程中,可以以事实为依据,重视客观性,依照统计科学根本理论,以及科学、标准的程序开展查询,查询结果可以反映客观情况,查询定论可以服气大众。

2、专业化

统计查询作业要充分表现统计科学的专业水平,力图排除非专业要素的影响。只要专业化才干客观化,只要专业化才干表现统计查询的科学化、标准化,才干防止片面化、随意化,查询结果才会得到用户认可。一起,专业化查询结果在面向非专业用户时,需求运用用户言语做出解说,这是专业化使用水平的表现。

3、标准化

统计查询准则标准制定的胜败、履行标准的力度和程度,与查询数据质量高低有着密不可分的联系。标准化的统计查询准则,不管哪个层面履行都具有统一性和标准性,没有灵敏操作空间,也没有变通性的破例。

4、法制化

统计法制建设是进步统计查询数据质量的重要机制确保。法令的强制性、统一性、普遍性的特征,标准和约束了个人和社会行动。统计法制主要任务是要确保查询的独立性、公正性和保密性。统计查询双方的权力和义务只要通过法令的方式加以固定,查询质量才会确保。

5、信息化

信息化是施行统计查询的根本手法,是进步查询数据质量的重要抓手。信息化贯穿统计查询一直,是进步现代统计查询功率和数据质量的重要确保。

二、调查过程中数据质量控制的具体标准

1、查询计划具有可行性

查询计划意图明白、举动详细、操作程序一致、依法进行。规则了详细查询办法、查询东西、查询过程、注意事项等。

2、查询作业机制齐备

作业机制是保证统计查询按查询计划履行、查询程序顺畅工作、查询过程有用工作,取得较高数据质量的保证。审阅内容包含查询组织设置、组织功能分工、查询人员责任、查询洽谈准则、查询质量审计准则的建立等。

3、合适的查询方法和办法

对于查询意图,断定合适的查询方法和办法。首要是根据不一样的查询办法,断定数据采集办法。包含数据来历、现场挂号记载、数据修正记载、数据输入、多源头数据比对记载,以及选用效率高、成本低的查询办法。

4、程序科学合理

统计查询过程明白,查询程序科学合理。查询程序根据统计学基本原理进行规划,表现科学化、系统化、专业化、规范化的特质。首要审阅查询过程是不是按照计划规则的程序履行,在规则的时刻严格履行规则的查询,不提前、不滞后、不延迟。

5、查询目标配合程度

建立在查询目标诚信基础上的查询,其数据质量是不言而喻的。被查询者的协作,有利于查询顺畅、高效地完结。首要审阅查询目标拒答率和查询项目答复完整率。

三、提高数据质量控制措施

1、进步统计人员本质,增强本身作业能力,确保统计数据质量跟着年代的展开和进步,新状况和新问题的不断出现,统计作业的使命和需求也不断发生着改变,这就需求统计人员不断加强学习、不断更新常识、不断接受新思想和新技术。要实在进步底层人员的归纳本质,就有必要仔细做好在职人员的训练作业,使训练作业政策化、准则化,最大极限地进步底层统计人员的事务能力、理论水平、职业道德。一起,统计人员要自觉地学习统计事务常识,进步事务和操作技术等方面常识,特别是现代统计查询、统计收拾、统计分析技术,注重可操作性与实用性,努力进步统计机使用水平,为统计直报和数据收集打好坚实根底。经过进步统计人员本质,展开开拓视界,改进常识结构和统计机使用技术,使统计人员能够学以致用,为今后统计作业的数据质量的提高供给了内在基础。

2、科学的定性和定量统计分析,确保统计数据完好性、完好性、及时性统计作业的根本是统计分析,经过统计分析完成统计作业“定量”的有些,以提醒其“定性”的内在联络和展开规律。进步统计数据质量要点从完好性、精确性、及时性。一是统计数据在统计信息的收集规模和内容含量上的完好性。需求统计查询掩盖的规模要完好,被查询目标的报表起报要完好。二是统计数据质量在统计信息客观实在性方面的精确性。对底层报来的各类报表有必要严厉审查,是不是按统计准则规则的目标填写,统计办法是不是精确,统计成果是不是精确,统计数据是不是契合底层单位的实践状况等,从数据收集的源头把好质量关。三是统计数据质量在统计信息时刻价值上的及时性。以求真务实、不断创新统计作业的手法和办法,缩短统计查询与数据成果的间隔时刻,以最快时刻统计数据,树立和标准统计信息准则,进步统计数据的时效性。

3、加大统计法律力度,确保源头数据的精确性坚持依惩办统计,依法治统计,依法兴统计。要加大《统计法》的宣扬力度,努力进步各级领导和广大统计人员的法律意识,为统计法律发明杰出的社会空气。加大处分力度,做到违法必究,法律必严,使各级领导和统计查询目标增强统计法制观念,深入知道准时、如实地报送统计报表与统计资料是每个统计查询应尽的责任,虚报、瞒报、拒报、迟报甚至假造、篡改统计资料均属违法行动,对招摇撞骗的单位要坚决严肃查处,罚款数额应当大幅添加,以震慑统计违法者,一起树立经常性的统计数据质量查看准则,统计数据质量的查看要与统计法律有机结合起来,不断加大频率、加大力度,逐渐树立全社会的统计诚信系统。

4、搞好统计查询办法是进步统计数据质量的条件国家统计局在《国家统计准则的整体计划》中提出了中国统计查询办法变革的长远政策,即“树立以必要的周期性普查为基础,以经常性的抽样查询为主体,一起辅之以要点查询、科学统计和少量的全部报表归纳运用的统计查询计划系统”指明晰抽样查询作为新统计查询系统的主题,精简全部统计报表。要进步统计数据质量,有必要坚持全部查询和抽样查询相结合的准则,对统计目标系统的设置应本着“精确、简化、系统、高效”的政策,本着减轻底层负担的准则,对现行的统计目标系统进行科学调整,防止了对整体单位的逐个查询和较多的中间环节,在较大程度上减少了各方面临统计数据在查询过程中的干扰,因此使得查询的数据较契合客观实践。它具有事前统计及控制抽样平均差错和便于对样本目标进行查看,防止查询作业中间环节的招摇撞骗的特色。大大进步了统计数据的精确性和及时性。

5、树立科学有效的数据质量评价系统计算数据质量的监控与评价是一项杂乱的、长时间的系统工程,可在机关统计部分内树立威望的数据质量监控和评价基地,树立健全完善的统计数据产品质量管理系统,对统计数据出产全过程实施全部质量管理,进步统计数据的完好性和透明度。完善数据质量评价系统时要环绕党政领导重视的首要经济查核目标加大审阅、评价的力度,多角度、全方位的进行审阅评价。对与相关部分统计有联络的目标,加强与部分的联合审阅力度,其他目标要加大与首要经济目标相关联的目标的审阅力度,使统计数据实在反映客观经济的运行状况。

6、加大新的统计技术的使用是进步统计数据质量的必要路径统计机技术不只可以实现数据处理高速化、数据传输网络化、数据储存资本化,然后降低统计数据在人工处理、传输、储存等环节上的技术性差错和逻辑性差错,而且有利于从机制上构成强有力的统计质量管理系统,保护统计数据管理相对独立性并有效地抑止随意虚报、瞒报以及统计数据质量的其他腐败行动。

结束语

保证统计资料的真实性、准确性、完整性和及时性成为统计法的价值目标和立法宗旨,它管理着统计法的各个条文,我们作为统计工作者,就应该做到坚持真实性,确保准确性,为全面提高统计质量而努力。

参考文献

[1]丁擘.完善我国统计数据质量控制的研究[J].企业导报,2013,15:100-101.

[2]黄建凯.浅谈如何提高统计数据质量[J].统计与咨询,2013,04:52-53.

篇2

[关键词]大数据;统计数据;准确性;评估方法;适用性

[DOI]1013939/jcnkizgsc201529041

1大数据的出现与应对

1.1大数据的概念特征

大数据的概念从字面上可以理解为庞大的数据集合,当然,如今的数据早已不局限于单一的数值变化,而是在数字网络概念中彼此交叠幂次增长的非结构化信息统筹。根据IDC报告,我们可知全球数据量的惊人变化,2009年80万PB,2010年增幅达50%,达到了120万PB,至2011年跃至190万PB,激增的数据量印证着大数据时代的到来,见下图。

2009―2011年的数据量变化柱状图

虽然对于大数据还没有约定熟成的理论定义,但是在本文中我们不妨直观地将其理解为涵盖数值数据和非结构化数据,并对其进行分析整合的海量数据集。

大数据的几项具有辨识度的特征,首先是数据集在体量上应超越TB数量级,其次是数据信息应多样化,有数值数据,也有像是图片、视频、音频等非结构化数据,再次是数据的产生、采集和处理应快速及时,最后是数据集整合的数据信息应具有全面性和有效性。

1.2大数据对统计研究的挑战

大数据的庞大数据体量,快速增长处理需求,多样化全面性数据整合等现实情况都让统计研究面临着巨大挑战。传统的单一维度的样本抽查的研究分析模式已经不足以保证统计数据的准确性。因此,我们不仅要扩大研究分析的样本量保证统计结果的客观性和真实性,还要通过增加反馈信息的呈现路径,激发目标群体的新型互动模式,将文字、图片、视频、音频等都纳入数据库,从而增加数据维度,获取高品质海量数据,实现统计研究新变革。

2大数据时代背景下统计数据质量的界定

2.1统计数据质量的含义

统计数据质量的核心在于其准确性,在大数据时代背景下,统计数据质量还需考量统计目的,即满足统计目的的具有准确性的统计数据呈现。

2.2统计数据质量的特征

根据上述统计数据质量的含义,我们可以提炼出有关大数据时代背景下统计数据质量的两点特征。第一,是针对数据内容,应在客户接受范围内控制误差,保证数据采集处理的快速及时,并符合统计目的。第二,是针对数据呈现,要有规范性的阐述,保证统计数据的口径计算等采用相对一致的方式,表达完整,直观易懂,尽量避免歧义冗长。

3各类统计数据质量的评估方法及适用性分析

3.1逻辑规则检验

逻辑规则检验法,是宏观的针对总量数据的一种评估方法,即根据统计数据中各个指标之间相互作用,彼此粘连的内在逻辑关系,来衡量测试数据的真实性和可信度。

由于这种逻辑规则检验法是基于传统的统计理论,且可操作性强,易被客户理解接受,所以在实际统计数据评估中应用广泛,常被用于政府统计部门的统计工作。但是,这种方法存在明显漏洞,因为其检验规则过于单一,只要不出现重大逻辑冲突则推论出数据可信,加上即使出现了逻辑矛盾,仅通过比较无法获知问题所在,无法确定问题数据的准确范围无法规避结果的多重性,使得结果相对粗略草率。

根据以上分析判断逻辑规则检验法的适用性,我们可以将其作为初步评估统计数据的方法,在宏观经济统计数据中以它为基础,结合其他方法,进行复式检验,能够更好地得出统计结论,获得民众理解和认可。

3.2核算数据重估

核算数据重估法,是一种对于逻辑规则检验法延伸拓展的评估方法,即基于待评估数据的核算体系重新设定的统计指标,从而重新估算统计数据,然后对比现实数据,实现对统计数据质量的评估。这种评估方法的基本思路是一种在重新计量中的重复调查,扩充针对性的资料,将理想数据与实际数据对比分析,找出问题所在。

这种重估统计指标的评估方法与逻辑规则检验一样是在假设基础核算构成准确性的前提下进行的,而重设的统计指标与现实统计的指标方式仍具有差异性,因此其对比评估的结果只能作为一种参考性依据,能找到问题数据的大致方向但无法呈现具体错误情况。它尤其适用于判断GDP的增速准确性。

3.3计量模型分析

计量模型分析法,也是一种针对总量数据的评估方法,即在难以确定统计数据确切逻辑关系的情况下,建立模型评估,检查是否出现差异情况。这种方法的关键是建立模型,寻找异常点,在操作过程中需要先根据统计理论和统计目的建立相应的计量模型,再将样本数据进行相应估算检查,反复调整,多次代入评估,最终得出结论。

3.4统计分布验证

统计分布验证法,是针对分类数据的一种评估方法,即在掌握了个体数据和分类汇总数据之后,基于已知的分布特性,验证理论性分布情况与实际统计数据分布情况是否相悖,进而得出评估结果。

这种评估方法的检验过程首先是通过理论分析和调查研究确定统计分布的特性,找到个体数据与汇总数据的分布形态,然后对比理论数据与待评估数据的分布是否一致,若是发现异常点则需要进一步验证分析其具体误差值情况,从而判断统计数据质量。这种评估方法的缺陷在于确定统计数据的分布特性,这是评估的前提,但也是在实际操作中最难攻克的关键。

3.5调查偏差评估

调查偏差评估法,是一种事后调查分析的方法,即通过对统计数据中调查偏差的评估,约束调查条件进行重复调查,以期获得最真实的统计数据。这种方法的开展是在预设存在可得的真实统计数据前提下,那么这个关键点就成为了该评估方法最大的痛点和争议点,因为是否存在理想调查条件下可得的真实统计数据是未知的,换言之就是假想的,没有科学依据的。加之在实际操作中,要进行有效的调查条件控制涉及误差参数的确定,计量模型的构建,同时在区域范围内实现多次重复调查的难度也很大,因此,调查偏差评估的实际应用有限,当下仅适用于像人口普查这类的地区性普查统计数据的分析。

3.6多维评估延伸

由于大数据时代统计数据内容的多样性,多维化,评估方法的多维延伸也成为必然。所谓多维评估法目前涉及四种的评估路径,即多级量度、指标检测、用户需求,以及统筹综合。虽然由于长期以来对数值统计分析的侧重,多维评估还在发展阶段,尚不成熟,但是随着统计数据的非结构化特性日益彰显和人们对于统计数据质量要求的日益提升,多维化评估将逐渐受到重视,得到完善应用。

4结论

本文分析了包括逻辑规则检验、核算数据重估、计量模型分析、统计分布验证、调查偏差评估、多维评估延伸在内的六种评估方法的概念特征,以及适用性。其中前三种都是针对统计总量的评估方式,而后几种则是针对分类数据的评估方法,涉及充分的信息采集,分布特性的确定,初始调查条件的确定,以及多维度的延伸。这些假定的前提与实际数据始终存在偏差,因此在获得真实数据上还是属于理想化推测,始终存在争议点,而且在实际操作中具有执行困难。

通过分析,我们不难发现目前各个对于统计数据质量的评估方法仍存在较大的缺陷,这直接影响到我国统计事业的发展和与之密切相关的经济社会的总体发展。因此,我们需要加强对统计数据质量评估方法的研究力度,进一步完善评估体系,适应大数据时代的发展需求,用多维度复合型的研究成果保证统计结果的客观性和真实性,还要通过增加反馈信息的呈现路径,激发目标群体的新型互动模式,实现中国统计研究的新变革。

参考文献:

[1]王华,金勇进统计数据准确性评估:方法分类及适用性分析[J].统计研究,2009(1)

[2]许涤龙,叶少波统计数据质量评估方法研究述评[J].统计与信息论坛,2011(7)

[3]程开明,庄燕杰大数据背景下的统计[J].统计研究,2014(11)

[4]崔路云基于大数据时代背景对统计学教育的几点思考[D].北京:首都经济贸易大学,2013.

[5]刘春燕论大数据时代的统计制度与方法改革[J].芜湖职业技术学院学报,2013(11)

篇3

关键词:关联规则;正关联规则;负关联规则;频繁模式树

中图分类号:TP311文献标识码:B

文章编号:1004-373X(2008)08-090-04オ

Positive and Negative Association Rules Mining Algorithm Based on FPNtree

QU Baida,CHEN Liping

(Communication and Control Engineering College,Southern Yangtze University,Wuxi,214122,China)オ

Abstract:In current,association rules mining mainly focuses on positive association rules,as AB,which has serious disadvantages only to mine positive association rules.It conceals connotative negative association rules among datas,so as not to explain certain items′ restriction relation in positive association rules.Positive and negative association rules mining algorithm based on FPNtree is proposed built on association rules conception and qualities of association rules.Traversing its prefix linked lists which can mine association rules comprising positive items as well as association rules with negative items,not causing negative association rules′ losses.Efficiency and feasibility of algorithm is analysed and has predominance over single algorithm only mining negative association rules in describing indeendence among association rules items.

Keywords:association rules;positive association rules;negative association rules;FPNtree

关联规则是从大量的数据中挖掘出有隐含关系的一种方法,自从文献[1]提出关联规则的问题以后,大量的学者对其进行了深入的研究和探讨。关联规则为:设有事件A和B,正关联规则类似与事件A导致事件B,形如AB这样的表达式,他只能使交易数据库出现的项集发生正面关联,无法发现数据中隐藏的另一种关系:负关联关系,事件A导致事件B不发生,即某数据项集A的出现会减少另一数据项集B的出现机会,甚至使得B不出现。但在实际中对负关联规则的研究却比较少,然而负关联规则依然能带来有价值的规则,这对于决策的作用也是不可忽视的。在商业领域,负关联规则可以帮助决策者牺牲自身小的利益为代价消弱某些大的商业欺骗以换取更大的利益;在医疗领域中,可以根据某些症状的存在与另外一些症状的不存在得到某一诊断结果;企业、市场可以通过综合考虑正、负关联关系,在销售、投资时同时考虑一些有利因素和不利因素,迎接更大的挑战。

尽管在应用中负关联规则非常重要,但由于研究起步晚且难度较大,负关联规则的挖掘还没有能够出现一种像Apriori[2]那样成熟,XinDong Wu在文献\[35\]中正式提出负关联规则的同时还提出一种能同时挖掘正、负关联规则的算法,在挖掘出正频繁项集的基础上考察他们的支持度和兴趣度,当他们不满足阈值要求时再考虑对应的负项集的支持度和兴趣度,如果负项集满足要求,就从中挖掘出包含负项目的关联规则。这种算法思想无法挖掘出所有包含负项目的频繁项集,该算法在生成频繁项目集时会造成丢失。针对以上问题,在包含正、负项目的一般化关联规则进行了比较深入地研究上,提出一种基于频繁模式树混合正、负项目的一般化关联规则挖掘算法,该算法不仅挖掘包含所有正项目的关联规则,而且还能够挖掘出所有包含负项目的关联规则。

1 负关联规则挖掘

1.1 单一正关联规则缺陷

[HTH]例1:[HTSS]假设有5 000个数据集,其中包含事件A和B,同时包含事件A和B记为A∪B,包含A的有3 000项,包含B的有2 500项,minsup=0.2,minconf=0.3,supp(A∪B)=0.25>0.2,conf(AB)=0.42>0.3,得到AB是强关联规则,再考虑ASB,supp(A∪SB)=0.35>0.2,conf(ASB)=0.58>0.3,ASB也是强关联规则,说明由于A的发生B发生的概率反而下降了,因此A和B应该是相互削弱的关系。这与AB相矛盾。由于conf(ASB)>conf(AB),ASB应该更可靠,因此A和B应该是负相关的的关系。

文献[35]提出首先考虑正项集,当正项集无法满足最小支持度和最小信度时再考虑负项集时,然而在例1中按照这种先挖掘正关联规则再挖掘负关联规则的做法将会淹没有效的负关联规则,进而造成某些潜在负关联规则的丢失,本文提出基于频繁模式树的正负关联规则平行挖掘算法,同时考虑正项集和负项集。

1.2 负项目

设任务相关的数据D是数据库事务的集合中有项集A和项集B。形如ASB,SAB,SASB的关联规则称为负关联规则,负的关联规则的支持度和置信度的定义和正关联规则相同,只是分别用SA和SB分别代替了原来的A和B。

首先介绍一个计算支持度计数的定理。

[HTH]定理1 [HTSS] |DB|为事务数据库中事务的总个数,对任意的负项目SA,设他对应的正项目A支持度计数(即在数据库中出现的次数)为A.count,那么SA的支持度为:

ИБSA.count=|DB|-A.count(1)И

证明:因为A.count+SA.count=|DB|;所以SA.count=|DB|-A.count,这是显然成立的。

应用该定理,扫描原始数据库,利用式(1)可以计算出所有负项目的支持度计数,然后将所有支持度计数不小于最小支持度计数minCount的正、负项目合并成一个集合,作为频繁1项集L1;用正整数记录正项目,用负整数记录负项目,并且在频繁1项集中,将各项按照绝对值的升序排列,如果同时含有绝对值相等的一对正、负项目,按照负项目在对应正项目前一位的原则,形成一个有序序列。

2 含负项目的频繁模式树FPN_tree的构造

2.1 基本概念

J.Han等提出一种用频繁模式树FP_Tree产生频繁集的fp_Tree算法,借助与定义对含负项目的频繁模式树(frequent pattern tree with negations,FP_Tree)进行如下的定义:

(1) 他由一个根(值为null)、项目前缀子树(作为根的子女)和一个频繁项头表组成。

(2) 每个项目前缀子树中的节点包括3个域:item,count和first其中item记录节点表示的项目,他可以是正项目也可以是负项目:count表示该项目出现的频度;first用于连接树中同名节点,如果不存在同名节点,则值为“null”。Current表示项目指针,child,parent,Sibling分别表示节点的子,父,和兄结构的指针。

(3) 频繁项头表的表项包括2个域:频繁项目名HEADS:HEADS[i].item=S[i].item; HEADS[i].count=S[i].count; HEADS[i].first=NULL。

2.2 算法思想及其方法描述

前缀链表遍历算法的基本思想是将事务数据库中满足最小支持度的所有项目看成是链表中的各个结点。每条事务看成是从某个结点经若干中间结点到达终结点的路径。从中找出满足最小置信度的路径即为所要发现的正负关联规则。下面给出了频繁模式树FPN_tree构造过程的具体算法:

(1) 第一次遍历事务数据库TID,用正整数记录正项目,用负整数记录负项目,利用式(1)统计各正项目及其负项目的出现频率,并计算所有正负项目的支持度。

(2) 将所有支持度计数不小于最小支持度计数minCount的正、负项目合并成一个集合。

(3) 对上述集合的顺序进行调整,将各项按照绝对值的升序排列,如果同时含有绝对值相等的一对正、负项目,按照负项目在对应正项目前一位的原则,形成一个有序序列,作为频繁1项集S1。

(4) 初始化表头数组HEADS:HEADS[i].item=S[i].iten;HEADS[i].count=S[i].count;HEADS[i].first=NULL;

(5) 将重排后各事务T调用函数insert(PL,T,parent)(首次调用时parent为NULL)插至前缀链表中。

FPNtree中由于引入了负项目,其构造方法与FPTree有所不同。对于数据库中的每个事务T,如果某个正频繁项出现在T中,说明T含有该正频繁项:如果某个负频繁项对应的正项目不出现在T中,说明T中隐含有该负频繁项。构造FPN_tree的主要思想就是将每个事务中包含的正频繁项和隐含的负频繁项按照S1的顺序插入到FPN_tree。

insert(PL,T,parent)

{c=getfirstitem(T);if(c=′’′)return;

If(PL=NULL)

{new(PL);PL>item=c;PL>count=1;PL>child=NULL;PL>parent=parent;

PL>sibling=NUILL:

i=location(c);new(q);q>current=PL;q>next=HEADS[i].first;HEADS[i].first=q;

insert(PL>child,T=delete(T,c),PL)}

else

if(PL>item==c){PL>count++;insert(PL>child,T=delete(T,c),PL);}

if(PL>sibling==NULL)

{new(P);P>item=c;P>count=1;P>child=NULL;P>parent=parent;

p>sibling=PL>sibling;

PL>sibling=P;i=location(c);new(q);q>current=P;

q>next=HEADS[i].first;HEADS[i].first=q;insert(P>child,T=delete(T,c).P);}

else insert(PL>sibling,T,parent);}

2.3 应用举例

假设有表1所示的数据库DB,最小支持度为3,构造含负项目的频繁模式树。

表1 各项目支持度计算[HT6K]

项目abcde-a-b-c-d-e

支持度4311423552[HJ0]

扫描DB,统计各正项的支持度计数,并由式(1)计算负项的支持度计数,结果如表1所示,选出F中支持度大于3的项,选出频繁项集Ll { a:4,-b:3,b:3-c:5,-d:5 ,e:4}。同时计算所有事务的正负频繁项1项集,如表2所示。(各节点以item,name,count形式记录)并依次将各事务中的正、负频繁项插入到FPN_tree中,如最终得到含负项目的频繁模式树如图1所示。

表2 事务数据库1及频繁项[HT6K]

事务TIDTID1TID2TID3TID4TID5TID6

项目a,b,eb,da,ca,eea,b,e[HJ0]

频繁项a,b,-c,-d,eb,-ca,-b,-da,-b,-c,-d,-e-b,-c,-d,ea,b,-c,-d,e

图1 正负频繁模式树

3 从FPN_tree中挖掘包含正、负项目的频繁项集

一般从频繁模式树中挖掘关联规则只需遍历事务数据库2次,第一次形成前缀链表,第二次确定某条事务是否与前缀链表的一条路径重合或者部分重合,从而发现关联规则。第二次遍历事务数据库TID,对重排后的每条事务T,若当前事务T完全或部分重合了前缀链表的某一路径,且满足大于小于minconf约束,就得到关联规则,本文采用在上述频繁模式树的基础上产生一个条件FP树,从而挖掘出所有的正负关联规则。

[HTH]算法2:[HTSS]

算法2建立在算法1所产生的FPNtree上面。他会递归调用自己,并且反复调用算法2产生新的FPtree。

输入:一棵用算法一建立的树Tree;

输出:所有的频繁集。

步骤:

调用FPN_tree (Tree,null)下面是对过程FPgrowth的伪码描述。

ProcedureFPN_tree (Tree,a)

ifTree只有一条路径P

then对P中的节点的每一个组合(记为Е陋В(1)

(1) 产生频繁集Е痢圈陋В并且把他的支持度指定为Е陋е薪诘愕淖钚≈С侄取

else对Tree的头表从表尾到表头的每一个表项(记为a)做(2)~(5)。

(2) 产生频繁集Е=a∪αВ并且支持度为a的支持度。

(3) 建立Е陋У奶跫模式库(conditional pattern base)和Е陋У奶跫树(conditionalFPtree)Tree2

(4)if Tree2!=БhА*

(5)then调用FPgrowth(Tree2,Е陋)。

从图1中的表项b出发,首先可以得到一个频繁集(b:3)。进而得到包含b的所有模式。顺着b表项的nodelink域,找到所有b的路径,,对第一条路径,虽然a出现4次,但他们同b在一起只出2次,所以把他们的计数改为2,得到。第二条路径中,得到,把这2条路径中的b项去掉,就得到b的条件模式库,{( a:2},这是下一步递归的依据。把这个条件模式库看作一个数据库,在上面运用算法一产生一个空的FPtree。

接着考虑-b,先得到(-b:3),顺着他的nodelink得到2条路径,,,但在有序的频繁项中,a与-b在一起只出现2次,所以把他们的计数改为2,得到,第二条路径中,得到,把这2条路径中的-b项去掉,就得到-b的条件模式库{( a:2},运用算法1产生一个空的FPtree。

其次从表项e出发,先可以得到一个频繁集(e:4)。然后,得到包含e的所有模式。顺着e表项的nodeink域,找出所有e的路径,,和,对第一条路径,虽然a出现了4次,b,-c,-d,e各出现2次,但他们同e在一起只出现了2次,所以把他们的计数改为2,得到。第二条路径中,得到,对第3条路径,得到。把这3条路径中的e项去掉,就得到e的条件模式库,{( a:2,b:2,-c:2,-d:2),( a:1,-b:1,-c:1,-d:1),( -b:2,-c:2,-d:2)},这是下一步递归的依据。把这个条件模式库看作一个数据库,在上面运用算法1产生一个新的FPtree,这个新树中有2个节点a:3,-b:3,-c:5,和-d:5,对这个路径中所有的节点组合产生频繁集,得到{(ae:3,e (-b):3,a(-b)e:3,e(-c):4,e(-d):4,e(-c)(-d):4,a(-b)(-c)(-d):3)}.,类似的考虑a:4,和-d:5最终得到两个空的FPtree。

最后考虑-c,先还是得到(-c:5),顺着他的nodelink得到4条路径,,< a:4,-b:2,-c:1,> ,< b:1,-c:1,> 和得到一个新的节点b:3,对这个路径中该节点组合产生频繁集,得到{(b(-c):3}。最终得到条件模式库和条件FP树如表3所示。

表3 条件模式库和FP树

项条件模式库条件FP树

b{(}Бh

-b{} Бh[HJ0]

e{,,}{(ae:3;e(-b):3;a(-b)e:3;e(-c):4;e(-d):4;e(-c)(-d):4;a(-b)(-c)(-d):3)}

aБh Бh

-d{,, }Бh

-c{,,< b:1,-c:1> ,}{(b(-c):3}

4 算法性能分析

FPN_tree算法与现有的挖掘负项目的关联规则的算法相比,在性能上主要有以下优点:

(1) 能够挖掘出所有的负关联规则:目前大多数含负项目的关联规则挖掘算法主要通过考虑频繁正项集的支持度和置信度,当他们不满足要求时,才考虑对应的负项集。但是对于非正频繁项而其对应负项频繁的项集就不能被挖掘出来,因此不能挖掘出所有含负项目的关联规则。FPN_tree算法将所有的正、负频繁项压缩到频繁模式树中,从中挖掘所有长度的频繁项集,所以能挖掘出所有包含正、负项目的关联规则。

(2) 不会使原始数据库增大:算法[6,7]为了挖掘出所有含负项目的关联规则,将所有项目的对应负项目都扩展到原始数据集中,再从中找出频繁项集,这样使得本来就庞大的数据库又扩大了1倍。本文提出的FPN_tree算法只是将频繁的正、负项目压缩的频繁模式树中,采用这种压缩结[LL]构存储负项目以及正项目,有利于使得原始数据库减小。

(3) 很多挖掘含负项目的关联规则挖掘算法都是基于Apriori算法,这需要多次扫描数据库产生大量的候选项集,通过反复扫描数据库模式匹配来检查一个很大的候选项集。FPN_tree算法将频繁项集压缩到一颗频繁模式树,使用模式增长方法挖掘出所有的频繁项集,从而减少了时间和空间的占用,最终产生出所有满足条件的正负关联规则。另外,FPN_tree算法进一步提高了算法的效率,即使会生成矛盾规则,通过规则的致信度的比较,就能够得出满足要求的关联规则。

5 结 语

本文对包含正、负项目的一般化关联规则进行比较深入地研究,提出一种基于频繁模式树的混合正、负项目的关联规则的FPN_tree算法。该算法将事务数据库中出现的正项目和隐含的负项目信息映射到内存中进行处理,平行挖掘正负关联规则。该算法打破了先挖掘正关联规则,其次再挖掘负关联规则这种单一的挖掘模式,从而造成重要负关联规则的丢失。同时该算法在描述关联规则项目间的相互独立程度上比已有的单一挖掘负项目的关联规则算法更具优势。

参 考 文 献

[1]Agrawa1 R,Imielinski T,Swami A.Mining Association Rules between Sets of Items in Large Database[A].Proceedings of the 1993 ACMSIGMOD Internatlona1 Conference on Management of Data[C].Washington DC,USA,1993:207216.

[2]Agrawal R,Srikant R.Fast Algorithm for Mining Association rules[A].In:Proceedings of the 20th International Conference on VIDB[C].Santiago,Chile:1994:487499.

[3]Wu X,Zhang C,Zhang S.Mining both Positive and Negative Association Rules\[J\].In:Proc.of ICML,2002:658665.

[4]Savasere A,Omiecinski E,Navathe S.Mining for Strong Negative Associations in a Large Database of Customer Transactions[C].Proceedings of IEEE 14th Intl.Conference on Data Engineering,1998.

[5]WeiGuang Teng,MingJyh Hsieh,MingSyan Chen.On the Mining of Substitution Rules for Statistically Dependent Items[C].Data Mining,ICDM,Proceedings 2002IEEE International Conference,2002.

[6]JeanFranqois Baulicaut,Artur Bykowski,Baptiste Jeud.Towards the Tractable Discovery of Association Rules with Negations [C].FQAS′00,2000:425434.

[7]左万利,刘居红.包含正负属性的关联规则及其挖掘[J].兰州大学学报:自然科学版,1999,33(8):288292.

作者简介 屈百达 男,1956年出生,博士研究生,教授。研究方向为现代控制技术与应用、模式识别与数据处理、运筹与决策。

篇4

关键词:数据挖掘;关联规则;Apriori算法;图书馆;数据库

中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2010)04-0784-03

Application of Association Rule in Data Mining of Students'borrowing Books from Library in University

KUANG Li-li

(School of Computer & Information, Hefei University of Technology, Hefei 230009, China)

Abstract: Based on the association rule technology in data mining, data of students'borrowing books from library in university can be analyzed, so as to discover the reading interest of the readers and find the related connection of book borrowing. This technology can be used to serve for book commendation and some work improving the management efficiency of libraries.

Key words: data mining; association rule; apriori algorithm; library; database

图书馆是高校进行教学和科研活动的重要支柱,素有“大学心脏”之称。随着科学技术的迅猛发展以及网络化、信息化程度的不断提高,人们对图书馆提供信息的能力、服务的广度和深度的要求也随之提高。现在几乎所有的高校都采用数据库技术对图书馆进行管理,其主要目的是为了方便图书馆对图书的采购、编目及对图书的流通进行快速、有效的管理。在图书的流通过程中产生了大量的数据,而学生借阅信息是其中最重要的数据之一。如何高效地找出有用的图书是图书馆数据挖掘中主要研究的问题。本文研究的目标就是从读者的大量借阅信息中挖掘出各学科之间的关联程度。

1 关联规则基础理论

关联规则(AssociationRules)的概念首先由RAgrawal等于1993年提出的,是反映一个事物与其他事物之间的相互依赖性或相互关联性,从而达到认识事物客观规律的技术方法。

1.1 关联规则

设I={i1,i2,…,im}为数据项集合即项集;任务相关的数据D是数据库事务的集合,其中每个事务T则是项的集合,使得T?哿I;每个事务由事务符TID标识;若A,B为两个项集,且A∩B=?I,则蕴涵式A?圯B称为关联规则。

1.2 支持度s(support)和置信度c(confidence,又称可信度)

关联规则表示为: A?圯B的蕴涵式,这里A?奂I,B?奂I且A∩B=?I。D中的规则A?圯B是由支持度(support)和置信度(confidence)来约束的。

支持度s表示规则出现的频度,具体描述是:

support(A?圯B)=P(A∪B)=s

置信度c表示规则的强度,具体描述是:

confidence(A?圯B)=P(B|A)=P(A∪B)/P(A)=c

1.3 最小支持度与最小置信度

假设支持度的阈值为min_sup,置信度的阈值为min_conf,若support(A?圯B)≥ min_sup且confidence(A?圯B)≥ min_conf时,认为A?圯B是有趣的,则此两值称为最小支持度(min_sup)和最小置信度(min_conf)。

1.4 项集(itemset)、k一项集和频繁项集(frequent itemset)

项的集合,称为项集。项集中所包含的项的个数称为项集的长度,长度为k的项集称为k-项集。包含项集的事务数,称为项集的频率或支持计数。

当项集的支持计数≥min_sup×n时,称为频繁项集;当项集的支持计数可能≥min_sup×n时,称为候选顶集。(n为D中事务总数)

所有频繁 k-项集的集合记作Lk,所有候选k-项集的集合记作Ck,显然Lk?奂Ck。

2 Apriori算法

Apriori算法是挖掘布尔关联规则的一种最有影响的算法――基于两阶段频繁集的方法。该算法利用频繁项集的子集也是频繁项集的特点,逐次扫描数据库,产生最大频繁项集,最后根据支持度和可信度产生关联规则。

Apriori算法的设计可以分解为两步骤来执行挖掘:

1)求出事务集D中满足最小支持度min_sup的所有频繁集;

2)利用频繁集生成满足最小可信度min_conf的所有关联规则。

Apriori算法具体可以理解为:首先,找出1-频繁项集的集合,该集合记作L1。L1用于找出2-频繁项集的集合L2,而L2用于找出L3,如此下去,直到找不到k-频繁项集。找每一个Li,需要扫描一次数据库;其次,设置不同的最小支持度和最小可信度,发现有用的关联规则。

3 关联规则算法在高校图书馆借阅数据中的挖掘

在进行关联分析前,首先要进行数据准备工作,将图书馆借阅数据进行预处理,形成关联分析所需的事务数据库,然后应用算法进行关联分析,最后挖掘出有效的关联规则。

3.1 数据选取

数据源来自淮北职业技术学院图书馆集群管理系统数据库文件,取2008年1月1日――2009年6月30日的借阅数据共68047笔。

本系统主要是对我校图书馆计算机专业的读者借阅信息进行关联数据挖掘。该数据库的信息见表1。

表1 图书馆读者借阅数据库

注:我校有两个校区(东校区和西校区),两校区图书馆提供的借阅数据是以日志形式存在的Excel文档,并且都是以月为单位导出的,因此首先应该将两校区各月分散的数据连接到一起,然后才能对数据进行统一预处理。

3.2 数据预处理

数据源中的数据可能不完整(如某些属性的值不确定或空缺)、含噪声和不一致(如同一个属性在不同表中的名称不同)。在这些不完整、含噪声、不一致的数据在进行数据挖掘,其质量难以得到保证,而且数据源中的数据量大,可能包含冗余,数据状况分散,不易综合查询访问等问题。这些都会影响数据挖掘的效率。因此可以在数据挖掘前使用清理、集成、变换、归约等预处理方法改善数据质量,从而提高数据挖掘的效率和质量。

3.2.1 数据的连接与导入

数据的连接是在Excel环境下进行的, 连接成一个文档后在 SQL Server 2005环境下进行数据的导入及提取,导入后的数据库结构和内容见表2和表3。

3.2.2 数据筛选

选取所需的信息,即计算机专业的姓名和索书号。

查询语言为:

use 图书借阅库

select 姓名,索书号 into JSJ读者借阅表

from 读者借阅表

where 单位 like‘%计算机%’ or 单位 like‘%多媒体%’ or 单位 like ‘%网络%’

执行后,得到所需的计算机专业读者借阅表,见表4。

从表4中可以看出:数据库(表)的每一行只描述了某次借阅行为,将项目信息分散了,这种格式的数据不符合关联规则算法的输入要求,是不能直接进行关联规则采掘的。其解决方法是使用SQL Server 2005所带的DTS工具可将数据转换成算法所需要的布尔型事务数据库。

3.2.3 数据转换,建立所需的事务数据库

具体过程:

1)只取中图分类号中的大类,忽略小类。如TP391.4/171取为TP391.4

查询语言为:

use 图书借阅库

select 姓名,索书号=left(索书号,charindex('/',索书号)-1)

from JSJ读者借阅表

2)删除读者只借阅一本书的记录,即冰山查询

冰山查询指在一个属性或属性集上计算一个聚集函数,以找出大于某个指定阈值的记录。

查询语言为:

use 图书借阅库

select 姓名,索书号 into JSJ读者借阅表2

from JSJ读者借阅表

group by 姓名,索书号

having count(姓名)>=2

3)用DTS工具可将数据转换成算法所需要的布尔型事务数据库见表5。

表5 读者借阅事务库

3.3 基于Apriori算法的图书借阅关联规则的挖掘

本系统是基于Apriori算法的关联规则挖掘,它将数据预处理后所得到的文本文件作为参数入口,对布尔型事务数据库进行挖掘。Apriori算法由VC++来实现,在与系统的结合是封装成组件的形式嵌入,通过ADO连接数据库,最后输出关联规则。

3.3.1 支持度与可信度的选择

在Apriori算法中,选择恰当的支持度与可信度是挖掘有效关联规则的关键。由于各个专业的学生借阅信息之间的关联程度有很大的不同,因此本系统中是通过对计算机专业学生借阅信息进行数据挖掘,并将结果进行分析、比较,最后确定相对精确的支持度和可信度的值。

例如,在本系统中,对计算机专业的局部学生的借阅信息进行挖掘后,得出支持度、可信度以及关联规则数目的对比关系表,见表6。

由表6可以看出:随着支持度和可信度的增加,规则的数目在逐渐减小,因此需要经过多次试验,才可能得到较准确的信息。在实验中选择了较多数据并进行了多次实验,最后选择最小支持度为0.2,最小可信度为0.45.

3.3.2 算法的实现

见图1。

本系统采用VC++ 实现,产生关联规则的主要代码部分如下:

POSTION postionl=LeftSets.GetHeadPosition();

while(positionl)

{leftset=LeftSets.GetNext(positionl);

if(LargeSet.Contain(*leftset) && *p!=*leftset)

break;

}

//计算关联规则的置信度

cnof=(float)LargeSet.support/(float)leftset->support;

//计算频繁项的支持度

supp=(float)LargeSet.support;

//输出关联规则

if(conf>=min_conf)

{OutputRule(*leftset,*sp,NULL,conf,supp);

}

else

{delete sp;

consadv->m_sets.RemoveAt(pre);

}

3.3.3 生成关联规则表

扫描数据库得出各类图书的支持计数信息,假设最小支持度为0.02,最小可信度为0.45,从而得出关联规则,见表7。

挖掘结果描述:

第一条规则表明借阅数据库方面的书籍有65%的学生同时借阅程序设计方面的书籍;第二条规则表明借阅网页制作方面的书籍有52%的学生同时借阅平面设计方面的书籍;第三条规则表明借阅电脑组装、维护方面的书籍有48%的学生同时借阅计算机网络方面的书籍等等。

把实验得出的结果与图书馆实际工作、读者调查相比较,结果是比较接近的,说明关联挖掘结果是有效的。

4 结束语

本文针对淮北职业技术学院图书馆读者借阅数据库,建立了基于Apriori算法的图书借阅数据关联规则的挖掘,用来分析图书馆中哪些图书被同时借阅,发现书籍借阅的关联规则,从而科学地进行建议借阅和图书推荐等服务,在一定程度上可以辅助图书馆的购书工作、教师的教学工作以及优化图书馆藏布局等。

参考文献:

[1] 陈文伟,黄金才.数据仓库与数据挖掘[M].北京:人民邮电出版社,2004:147-151.

[2] JiaweiHan,MichelineKamber.数据挖掘一概念与技术[M].范明,孟小峰,等,译.北京:机械工业出版社,2001.

[3l 夏火松.数据仓库与数据挖掘技术[M].北京:北京科学出版社,2004:146-155.

[4] 涂承胜.关联规则挖掘的常用算法及其比较分析[J].计算机技术,2006,22(3):22-23.

[5] 李晓毅,徐兆棣.关联规则挖掘的算法分析[J].辽宁工程技术大学学报,2006,24(2):319-302.

[6] 章立民.SQL Server2000完全实战―数据转换服务(DTS)[M].北京:中国铁道出版社,2002.

篇5

关键词:统计数据;数据失真因素;解决对策

中图分类号:O213.1 文献标识码:A 文章编号:1001-828X(2012)12-0-01

真实性对统计数据工作十分关键。统计数据的失真会给各部门的决策计划带来致命性的偏差,也会间接影响经济预测的准确度,产生许许多多的负面效应。因此,统计数据失真的原因需要认真分析并加以解决,从而保证政策决定的准确性,为国民经济和社会发展奠定数据基础。

一、统计数据失真原因的分析

1.统计数据失真往往有多方面的原因构成。从源头开始,统计人员的道德水平和统计实施过程中的标准规范会给最后的数据带来很大影响。近些年来,社会经济水平虽然在提高的过程中,但更多的人们行为规范逐渐缺失,诚信等道德标准变得愈加失衡。当诚信成为一种奢侈时,对统计数据结果的真实性就难以有太大期望。这种现象从基层部门开始蔓延,一步步侵蚀到各级领导干部之中,成为统计数据保真过程中的一块“毒瘤”。

2.统计部门的规章制度也与统计数据的真实性有很强的关联。在基层统计机构里,往往没有一套成型的统计流程和制度。在统计实施的过程中,统计人员若没有很强的自律意识,他所得到的数据真实性就很容易被主观及客观因素影响。这是一种严重的违法行为,但又因为基层监督的难以实施性使这种错误不能得到有效地控制。一而再,再而三的非规范性统计,对整个数据统计的危害十分严重,这些调查者和基层单位不仅逐渐脱离自己本身存在的意义价值,也游走在法律的边缘,有待治理。

3.政府部门的“政绩性”统计太多也影响了统计数据的真实性。统计虽然无阶级性,但因为统计过程中要接触到各种阶级的人物,使“官方数字”成为一种领导决定的非真实性统计结果。快速制造一些政绩,成为基层官员向上攀登的一条捷径。脱贫率、扫盲率,计划生育率、城建绿化率……这些数据的整体状况衡量了基层官员的施政措施的好坏。因此部分官员就无中生有,或报告虚假的统计数据来表现出自己的优秀政绩。这是统计过程中的一条急需治理的不正之风。

4.除了统计人员和政府部门的人为因素,统计规律中的一些“系统”问题也影响了统计数据的质量。这些“系统”问题大致分为三种;一是统计过程中被统计对象的实施效果欠佳,未能达到最初设定的统计标准;二是统计数据偶尔会发生失效的情况,这与时效性等因素有关;三是由于统计政策施行时间过长,不能有效的减少曾经出现问题的数据,降低了统计质量。

5.统计数据零散,汇总信息的方式落后。很多统计部门都是把信息数据的所有来源归于基层,散落的信息零零整整统计上来,其真实性就大打折扣了。数据重复、数据繁杂都给统计人员的汇总带来了不便,在忙碌中出错当然也不可避免,一些望尘莫及的高标准数据难以出现。

二、解决统计数据失真问题的对策

针对以上分析得到的原因,可以相应的采取一定措施进行更正,提高统计数据真实性。

1.提高基层统计人员的职业素养和行为规范。这项措施可以从两个方面施行;一是对不合格或多次出现类似问题的统计人员进行停职或撤职处理,起到警示的作用;二是采取授课、培训等方式不定期的进行知识和技能提高。不管是哪种施行方式,在基层统计部门长时间治理之后,还会出现因道德缺失等问题造成的统计失实的话,奖惩手段就必须强硬和果断。

2.在统计部门内部形成良好的自律规范。这不仅对统计人员的文化素养有所要求,而且也考验了部门的纪律水准和实施效力。自律的初期必然需要他律来辅佐,在统计部门建立一套相互监督的管理机制十分必要。对于能够有效完成统计工作的统计人员,可以在部门进行榜样示范,并且部门职位晋升的考量标准也要紧抓业务水平。对于虚假报数据的统计人,即使是较高职位的人物,也绝不手软。

3.坚决杜绝“政绩性”统计数据的出现。要制定一套有效地干部管理体制。我们必须进一步完善干部管理体制,对各级干部的考核、评价与相应的升迁与任免,要建立严格、科学、规范的业绩评估制度,如授权专门评估机构评估、评估前不可先通报以及对违规行为的处罚办法等,严格防止“官出数字、数字出官”的腐败现象。

4.降低统计工作因“时效性”等原因造成的不准确。要增强统计系统之间的宏观调控和微观管理财务的统计职责,并定期不定期的对各部门的统计数据质量进行抽查和评估,对有问题的数据及时处理,不拖后。同时,在各统计部门之间建立良好的计算机网络系统,优化统计部门任务分配,增强统计人员的积极性,提高统计效率,增强统计数据质量。如果在统计过程中,能灵活利用不同方式的调查统计方法,并科学的进行统计方式的规划,那么数据质量必然会得到保证。对于在经济市场中不同层次需求的反馈,统计采用的方式方法一定要有所差异化,多种手段多管齐下,因事制宜,才能更加全面的获取重点及全局性的数据。在统计过程中,不仅可以宏观的对各种指标性数据进行采集,也可以把一些关于民生、文化、教育及环境健康等有关和谐社会建设的数据划入整个统计评估系统。优质系统的数据评估体系无疑提高了统计过程中的简便性和高效性,同时,这些被统计的数据在此系统的管理下会更加真实透明,完整的反应经济社会发展状况。提高效率且提高准确率这种状况往往是统计人员十分愿意看到的。

5.对于统计中被制约住的很多规则可以合理改变。统计的过程中,数据分散,数量巨大,且标准很难统一,这使得原有的条例和规范并不能在实际操作中有效地应用。统计人员应该在工作中注意留心可以优化的部分,在层层汇报过程中抓住要点,调高准确率,并严格控制汇报过程中的各种人为和非人为因素造成的偏差,从而使最终的数据更加真实完整。这样就是一种十分有益的改良方式,把固定的规则搞活,把数据采集方法解放出来,不断改进。

真实性是工作中的重中之重,是统计工作中数据的根基所在。由于统计工作能监测整个国民经济的健康状况,显示社会和国民经济的发展情况,并成为沟通国民经济社会的主要渠道,因此,我们必须要进行及时、系统、准确、全面的统计。同时,也要通过一些途径,有效地提高统计数据的质量。这将是未来统计部门必须要重视的工作重心,也是整个政府机关的工作重心。

参考文献:

篇6

【关键词】3-6岁幼儿;计数;手部动作

1 问题提出

计数是幼儿数认知能力发展的重要里程碑,它标志着儿童数词系统的获得和使用,是儿童建构和发展其数学知识体系的前提和基础,体现了儿童对数实际意义的理解。格尔曼和加利斯特尔极其肯定儿童的计数能力,认为计数在儿童早期数概念的发展中具有重要作用,而且他们认为幼儿已经在此方面表现出了惊人的认知能力。同时大量有关幼儿数学学习方面的研究揭示,幼儿在计数过程中会出现手部动作,并且当幼儿被允许触摸或者移动被数物体时计数的准确性会提高。皮亚杰认为:知识来源于动作(动作起着组织和协调作用)而非来源于物体[1]。幼儿计数时自发的手部动作就是为幼儿提供了计数的知识。如周燕等人进行的研究中发现,在进行点数7个、15个及30个物体时,4岁组和5岁组90%以上的幼儿在数数的时候,都是用手指挨个指着物体,只有极少数的幼儿没有明显手部动作[2]。而在斯塔基和库帕的研究结果也证实,幼儿仅用目测所能计数的物群数量较小,且准确率不高,然而在借助手部动作的支持下,能够计数较大数量的物群且正确率较高。这些研究证明当禁止幼儿指、摸和移动时计数的准确性会降低,计数范围会减小。可见幼儿的指、摸和移动等动作与计数的准确性有关。

而在对手部动作的研究中更多的是研究手部动作的功能的讨论上。主要可以分为两个主要观点。一种观点认为手势的作用在于记录数过的项目,也就是把数过的和没有数过的分开。另一种观点则认为手势是把抽象的数字和实际的物体联系起来的中介物。手势表示出实际物体的数量,同时手势与数字保持一致。这样抽象的数字与实际的物体就形成了一一对应的关系。最近Graham等又提出了手势所具有的3个功能[3],即作为过渡时间的工具,作为外部表征,促进认知发展。总体上来看,对幼儿已有研究更多是在讨论手部动作功能和手部动作对幼儿计数准确率的影响,并未系统揭示幼儿在怎样情境下会自发产生手部动作以及这种手部动作在年龄上的发展趋势,从而不能为教师在教学实践中为幼儿提供丰富、适宜的经验给予有效的支持。

2 文献综述

总的来说,以往对于幼儿计数的研究主要是针对幼儿计数的规则和发展,幼儿计数对于数概念形成作用方面以及幼儿计数测率的应用。其中对幼儿计数的规则和发展的研究主要是从认知发展特点方面出发进行探讨,而在幼儿计数的策略应用方面只从问题难度对手部用作产生的影响进行探讨。并没有系统解释幼儿在用手点数方面的发展特点。通过查找相关资料,现将已有的相关研究结果整理分析如下:

简单的说,计数就是一种有目的、有手段、有结果的操作性活动,其结果表现为数的形式。其实质在于在具体的集合元素和作为数的标准集合的自然数列各项(每个自然数都是某个集合类的标志)之间建立一对一的对应关系[4]。首先提出幼儿计数能力的是格尔曼和加利斯特尔,他们对幼儿数数的技能进行了研究,提出了数数不仅仅是单纯的语言能力,而是受到数数基本规则即一一对应规则,固定顺序规则和基数规则支配的复杂认知能力[5]。

在对幼儿计数发展的研究中,在沈家鲜等人的研究中可以反映出幼儿在早期学习计数一般要经历口头说数,按物点数和说出总数这三个阶段[6]。口头说数可以使幼儿获得数词的名称以及自然数顺序方面的经验。按物点数即用手逐一指点物体,同时有顺序地说出数词,使说出的一个数词与手点的一个物体一一对应。说出总数是指按物点数后,说出的最后一个数词代表所数过的物体的总数即回答“一共是几个”的问题。

在手部动作与计数关系方面,很多学者也作了相关研究。在张华的研究中显示[7],儿童使用触摸式点数策略的人数最多,而且数列的数目越大,使用该策略的人数也越多,在数30的任务上,91.3%的3岁儿童、81%的4岁儿童使用触摸式点数的策略。

幼儿计数是幼儿数概念形成的第一步,幼儿在计数过程中借助于手部动作来形成数词和实物的一一对应。在周燕等人的研究中显示,几乎所有的4、5岁幼儿都能遵循格尔曼的数数的基本规则点数出30以内的物体。

3 研究方法

3.1 研究方法

本研究将采用测查法进行。测查题目主要从数字大小(数字的大小按照幼儿计数发展的年龄特点来确定)、排列方式、手部动作三个维度出发进行编制。排列方式分直线形排列、环形排列和无规则散布;手部动作分为用手点数和不用手点数;在数字大小上,小班为 4、5、6中班为8、14、19,大班为13、18、23。

3.2 取样

因为考虑到不同幼儿园的相对应年级的数学课程进度可能不同,所以本研究只选取一所幼儿园(即北京师范大学附属幼儿园牡丹分园,后简称为牡丹分园)作为测查对象。在牡丹分园的小、中、大班分别随机抽取30个幼儿进行测查。

3.3 测查材料

小班采用共6个积木,按照每道题目要求的数量以及排列方式摆放;中班采用共19个积木,按照每道题目要求的数量以及排列方式摆放;大班采用总共23个积木,按照每道题目要求的数量以及排列方式摆放。

3.4 测查过程

测查在幼儿园一间相对安静、光线良好的房间中进行。主试在幼儿测查前准备好相关的材料。在正式测查开始之前,主试会通过与幼儿交谈的手段消除幼儿的紧张情绪以及与主试的陌生感,尽可能保证幼儿在自然、平和的状态下参与测查。

将积木摆放好之后,首先无要求让幼儿数出积木总数,记录其是否正确以及是否用手点数。之后分别要求幼儿用手点数和不能用手点数,记录其是否正确。在每次幼儿数完后将积木拿出幼儿视线摆放下一道题,以避免练习效应的影响。

3.5 数据分析

总共测查人数为90人,本研究将定性与定量研究相结合。所得数据将用Spss for Windows(11.5)统计软件包建立数据库,进行数据管理,采用频数分析、显著性检验等统计方法分析数据。

4 结果分析

本实验研究的结果主要分为两部分,第一部分比较幼儿用手点数和不用手点数的正确率,进而从中寻找幼儿用手点数的发展特点;第二部分进一步分析影响幼儿自发用手点数的各主要因素,以求更深入地探究影响幼儿用手点数发展的因素,为实际教育工作提供一定的实证基础。

4.1 幼儿用手点数和不用手数的正确率比较分析及其发展特点

在本部分中将用手点数过程中遵循一一对应、固定顺序原则,并能够正确报出数列的数目作为评价幼儿数数准确性的指标。而不用手点数则以幼儿最终报出的数列数目作为幼儿数数准确性指标。由于小班与中、大班的题目数量不同,所以这里均采用正确率进行分析。

4.1.1 同一年龄幼儿用手点数与不用手点数的正确率比较

如图1所示,在同一年龄组上,用手点数和不用手点数的正确率有差异,前者均高于后者。进一步的配对样本t检验表明:小班幼儿两种点数方式的正确率在.01水平上有极其显著差异[t(df=29)=3.564**,p=.001

由此可见,对于任何一个年级水平幼儿来说,采用点指数数策略的幼儿能够取得更好的成绩。也可以说,用手点指是提高小、中、大班幼儿数数正确率的重要方法之一。

4.1.2 不同年龄幼儿用手点数与不用手点数的正确率比较

采用单因素方差分析,对用手和不用手两种条件下,各年级的正确率进行检验。表1和表2呈现了单因素方差分析表和事后检验表。如表1-表4所示,在用手条件下,三个年级的正确率间无显著性差异[F(2,87)=2.706,p=.072>.05];但事后检验表明,中班的正确率在.05水平上显著地低于小班[p=.042.05],但事后检验表明,各班之间的正确率并无显著差异。这说明,在不用手条件下,各班的点数成绩大致相当,这可能是因为三个年级儿童不用手点数的能力发展还处于量变的阶段,各年级间并没有产生质变的发展。而在用手点数的能力发展上,中班的成绩显著低于小班,而小班和大班、以及中班和大班之间并无显著差异,这可能是因为中班儿童处于用手点数和不用手点数的过渡期,用手点数的能力可能受到不用手点数能力发展的影响。这一点还需要研究加以进一步探索。

4.1.3 用手点数和不用手点数正确率之差

图2表示的是各年级用手点数和不用手点数的正确率之差。对各年级正确率差进一步采用单因素方差分析,结果表明(见表5):各班正确率之差间无显著性差异[F(2,87)=1.672, p=.194>.05]。事后检验(见表6)表明,三个年级的正确率差之间在.05水平上均无显著性差异。这一结果说明,用手点数和不用手点数能力间的差异在各年级水平上均无显著差异,即各年级儿童两种点数能力的发展水平差异大致相当。

4.2 幼儿在何种情况下会自发点数

自发点数是指不对幼儿是否用手点数做出要求;而在提供不同数目和不同排列条件下,记录幼儿的动手情况。本部分先对幼儿自发点数的情况进行整体描述,然后对数目及排列方式这两个重要影响因素的作用情况进行进一步分析。

4.2.1 无要求条件下各年级的手部动作参与情况

图3表示的是无要求条件下各年级儿童用手的情况(即自发点数的情况)。对各年级自发点数的成绩进行单因素方差分析,结果表明(见表7):各年级自发点数的成绩在.05水平上有显著性差异[F(2,87)=3.567*, p=.032

4.2.2 积木数目对手部动作量的影响

图4表示的是不同积木数目下,儿童用手自发点数的情况。进一步采用单因素方差分析(见表9),表明在不同数目条件下,儿童自发点数的数量在.05水平上无显著性差异[F(2,87)=.392, p=.677>.05]。事后检验表明(见表10),不同积木数目条件间,儿童自发点数量并无显著性差异。这一结果表明,积木数目对于儿童自发用手点数并无明显的影响。

4.2.3 不同数目条件下各年级用手量的比较

进一步对不同积木数目条件下,各年级自发点数的情况加以分析。图5显示了不同年级儿童在不同积木数目条件下自发用手点数的数量百分比。进一步对各年级用手量进行单因素方差分析(见表11-表13),结果表明:小数条件下,各年级自发点数量在.01水平上极其显著[F(2,87)=5.056**, p=.008.05];大数条件下,各年级自发点数量在.05水平上有显著差异[F(2,87)=3.108*, p=.05]。进一步事后检验表明,在小数条件下,小班与中班、中班与大班之间均有极其显著差异;在大数条件下,小班与中班之间有显著差异。这一结果表明,在积木数量很少和很多的情况下,中班儿童较少自发用手点数。这指出了这样一种可能性,即中班儿童自发点数的能力处于过渡发展期,小班儿童会有用手点数的倾向,而大班儿童已将用手点数掌握为一种有效的策略,但中班儿童则已经开始摆脱小班儿童的倾向,同时却未发展起有效的策略掌握,因此表现并不好。

对各数目条件下,各年级的用手量进行单因素方差分析,结果显示:

4.2.4 不同排列对手部动作的影响

进一步对不同排列方式下幼儿自发点数的情况加以分析。图6显示了不同排列方式下幼儿自发点数的百分比。单因素方差分析(见表15)表明:在各种排列方式下,幼儿手部动作量(即自发点数百分比)在.05水平上无显著性差异[F(3,116)=.335, p=.800>.05]。事后检验(见表16)表明,幼儿自发点数量在各种排列方式下并无显著性差异。这一结果表明,不同排列方式对幼儿自发点数量并无显著影响。

4.2.5 不同排列方式下各年级用手量的比较

进一步对不同排列方式下,各年级自发点数的情况加以分析。图7显示了不同年级儿童在不同排列方式下自发用手点数的数量百分比。在无规则排列条件下,对中班和大班的用手量进行独立样本t检验,结果表明在.05水平上有显著差异[t(58)=-2.557*, p=.013.05]。进一步的事后检验(见表20)表明,直线排列条件下,小班与中班、中班与大班之间在.05水平上有显著差异;规则条件下,中班与大班之间在.05水平上有显著差异。这一结果表明,在直线和规则条件下,小班和大班幼儿能更好地进行用手点数;在无规则条件下,大班幼儿用手量也多于中班儿童,但在环形条件下,各年级间无显著差异。即在难度较小的排列方式下,小班和大班幼儿的表现均优于大班幼儿;而只有在难度极大的排列方式下,各班表现才无差异,即小班和大班幼儿在难度极大的排列方式下用手点数的能力无法得到充分发挥,或在用手点数这类积木的能力还未充分发展。此外,这一结果再次说明,存在中班幼儿自发用手点数能力发展过渡期这一可能性。这需要以后研究的进一步考证。

5 讨论

5.1 点数的正确率以及发展特点

在用手点数与不用手点数的正确率比较中,各年龄段的幼儿用手点数与不用手点数正确率均呈极其显著差异,说明幼儿在有手部动作帮助情况下计数的正确率明显高于不用手点数时的正确率。

由表2可以看出,小班和中班在不用手条件完成任务的情况没有显著性差异;小班和大班在不用手条件下完成任务的情况也没有显著性差异;而中班和大班有显著性差异,即大班在该条件下的完成情况优于中班。结合图2和表2我们可以发现,在不用手点数的情况下,正确率随着年龄的增长而提高,中班到大班则更加显著。在赵振国的研究中发现,3-6岁儿童的数量估算能力在各项任务上均存在显著的年龄差异。而且估算总体上也表现出有非常显著的的年龄差异[8]。与本研究结果一致。

在手部动作对幼儿计数准确率影响的发展特点上看,虽然三个年级在点数与不点数正确率的差异检验中并不存在显著性。但是我们可以单从描述统计上看图3,三个年级各自的正确率的差值的确是呈下降趋势,即三个年级用手与不用手数数正确率的差别正在不断缩小,说明手部动作对幼儿计数准确率的影响随着年龄的增长而不断减小。

5.2 不同情境下幼儿使用手部动作的量

在无要求的条件下,由表4可见,小班用手量显著地高于中班,中班又显著地少于大班,小班和大班之间无显著性差异。但是从本人实际的测查过程中发现,幼儿用手点数出现了四个层次上的差别,这四个层次是:用手移动积木,用手触摸积木,用手点但不触碰积木,将手悬在头部一侧点数。这四个层次难度依次升高。而用手移动积木基本上发生在小班,还有大部分幼儿是用手触摸积木,有少数的幼儿会出现用手点但不触碰积木的情况。中班则以用手触摸积木,用手点但不触碰积木的居多,有少数幼儿会将手悬在头部一侧点数。大班则是大部分幼儿都以将手悬在头部一侧点数积木,有少部分幼儿用手点但不触碰积木,极个别也有用手触碰积木的情况。这样,结合实际测查观察,大班的用手量不一定高于中班。

在分析积木数目对幼儿用手的量的影响中,我们可以发现在不同数目条件下,各个数目间均无显著性差异。但在计算小数目积木时,中班的用手量极其显著地少于小班和大班;在计算中数目积木时,各班没有显著性差异;在计算大数目积木时,中班的用手量显著地少于小班。小班到中班是一个快速的发展阶段,中班在计数时候明显用手量少于小班,再一次说明了小班到中班是幼儿数学能力的快速发展阶段。并且结合实际测查过程中观察到的情况,实际上大班幼儿脱离手部动作点数的情况要好于中班幼儿。

在分析空间排列对幼儿点数的影响中可以发现,在各个排列方式之间,儿童手部动作使用量均无显著性差异。虽然幼儿手部动作的量并不存在显著性的差异,但是我们单从图7中可以明显看到,随着排列方式的不断复杂,幼儿的手部动作量也随之增多。但是其中的环形虽然比无规则散布的排列方式简单,但在实际的实验呈现的结果却是环形用手的百分比高出了无规则散布。从实际的实验过程中发现,幼儿在数环形数列的时候,多会用一只手点住第一个积木,另一只手则按照一一对应的原则,以固定的顺序完成点数。另外,数数的策略会跟任务的难度存在一定的关系,任务难度过高,这种有手点数的策略使用会下降,所以无规则散布的用手率会低于环形。且无规则散布条件下幼儿点数出现了将边点数边重新排列积木的情况。最具代表性的一个幼儿是将点数过的积木移动,并且排列成规则矩阵形状。这说明在无规则散布条件下幼儿计数表现出将无规则趋于规则化的特点。

在不同排列下各年级用手量的比较中,由表8可见: 直线排列下, 小班用手量显著多于中班, 大班用手量也显著地多于中班。无规则散布下,中班用手量显著少于大班。在环形排列条件下小、中、大班用手量没有显著性差异。

6 结论

6.1 幼儿在用手点数的情况下正确率会大大提高。

6.2 幼儿在不用手点数的情况下,正确率会随着年龄的增长而增长。

6.3 “正确率差=用手的正确率-不用手的正确率”会随着年龄的增长而减小。即随着年龄的增长,手部动作对幼儿计数正确率的影响逐渐减小。

6.4 在无要求条件下,各年龄组幼儿用手情况会随年龄的增长而减少。

6.5 从总体的数目大小上看,数目的大小对幼儿手部动作不会产生影响。但在同等级的小数目的计数中,中班的用手量都极其显著地少于小班。在同等级大数目的计数中,中班的用手量显著地少于小班。

6.6 从总体的排列方式对幼儿手部动作的影响上看,排列方式越复杂幼儿用手点数的人数越多,从各个排列方式上看,直线排列中,中班幼儿用手点数人数明显少于小班。

7 教育建议

在结合上述数据分析结果以及对幼儿数学教育实践现状和问题的分析思考,作出以下建议:

在前面的数据分析中我们也发现,随着年里的不断增长,幼儿在计数过程中的手部动作使用量会逐渐降低。并且手部动作对幼儿计数正确率的影响逐渐减小。所以我们在对幼儿的计数教学当中应当鼓励幼儿尽可能的少动手点数,以脱离幼儿在不必要的情况下对手的依赖。

中班幼儿计数8的用手量要明显少于小班计数4的用手量。可见在对小数目的计数中,小班到中班有明显的发展。从我们日常的教学当中,中班可以小幅度提高幼儿幼儿计数的范围。

8 研究的不足和今后可讨论的方向

本研究通过量化的测查揭示了小班到大班幼儿在用手点数和不用手点数的准确率的发展状况,以及幼儿在何种情境下会自发的使用手部动作来帮助计数。由于本人的时间、精力有限,知识积累与能力的不足,本研究只进行了小规模的测查,研究设计也存在着很多缺陷,现象和问题是否普遍存在,有待更大规模和更严密的研究。

8.1 研究的不足

8.1.1 数据收集

由于与幼儿园方面时间协调问题的关系,本研究进行的十分匆忙,对于可能发生的情况缺少足够的准备。如对于小、中、大班的全部测查不能由本人一人进行,导致了数据收集上的不具体,不明确。

8.1.2 编码标准

由于本研究的测查过程有多人参与,而在测查前没有预计到幼儿在实际的点数过程中会分为多个层次:用手移动积木,用手触碰积木,用手点但不触碰积木,手只悬在头部附近点数。每次测查后负责各个年级的测查人员又没有及时进行交流协调,这样导致了中班和大班对于是否用手点数的标准不同。最终导致了统计数据中,大班的用手量明显高于中班,背离了最初的用手点数的人数随年里增长而减少的假设。

8.2 今后可讨论的方向

在研究中我们发现当幼儿被要求不能用手点数时候,很多幼儿会自发的以点头代替手部动作,点一下头数一个数,甚至有很多小班幼儿用嘴对准要数的积木,边数边点头。这样就形成积木-点头-数词的一一对应关系。今后可以对于幼儿用点头替代手部动作作为实物与数词的中介方面加以讨论。

参考文献:

[1] 皮亚杰、英海尔德《儿童学力学》(中译本),商务印书馆1980年版,第13页。

[2]周燕,庞丽娟,赵红利,4- 5岁幼儿数数行为的规则性与策略化应用特点的研究,心理发展与教育,2000年,第1期,第21页

[3] Graham, Theresa A. The role of gesture in children’s learning to count. Journal of Experimental Child Psychology, 1999, 74(4)。

[4] 苏.A. M.列乌申娜著.学前儿童初步数概念的形成.曹筱宁,成有信,朴永馨译.北京:人民教育出版社,1982,第11页。

[5] Gelman R,Gallistel R.The Child’s Understanding of Number, Cambridge. MA:Harvard University Press.1978.page9.

[6] 沈家鲜,四岁儿童数概念形成过程中的几个问题,心理学报,1979年第1期第15页。

篇7

                 ————100以内数的认识(二)

内容:教科书6—9页

教学目标:

1、在能读写100以内数的基础上对数的读写规则进行概括。

2、 在将现实问题转化为数学问题(天上的鸟多还是冰上的鸟多,实际上是求47大还是32大) ,并经历用数学符号表示数的大小关系(数学思考、数感)的过程中,正确进行100以内数的大小比较(知识)。

3、感受数学与日常生活的密切联系,体验学习数学的作用。

学生知识经验分析:

20以内数的大小比较是100以内数的大小比较的知识基础。

100以内数的读写是学生在生活中积累的经验。

重难点关键分析:

本节课重点使学生学会将现实问题转化成数学问题来解决,体会数学在人们生活中的作用。100以内数的大小比较的方法的掌握以及用符号来表示是本节课的难点和关键。

教学设计:

(一)                    创设情境,提出问题

师:上一节课我们随着小科学家们来到南极参观考察,这一节课继续我们的南极之行好吗?。

出示情境图(把文字遮盖),学生独立观察情境图。

师:说说你看到了什么?

师:根据这些信息你能提出哪些数学问题?

引导提出以下问题:天上有多少只海鸥?冰上有多少只海鸥?一共有多少只海豹?左边有多少只企鹅?右边有多少只企鹅?天上的海鸥多还是冰上的海鸥多?或天上的海鸥比冰上的海鸥多多少?左边的企鹅比右边的企鹅多多少?

师:同学们提的问题可真多,这些问题正好是小科学家想知道的,我们来帮他们解决吧!

(二)                    合作探究 解决问题

1、估数、数数

师:大家都很想知道海鸥、海豹、企鹅的只数,现在就请大家来估计一下,它们各有多少只?

学生独立思考后,说出估计数,并简单说说是怎样估计的。

师:为了得到准确的数据,靠估计是不行的,我们还是要认真的数一数才行。

教师引导学生用喜欢的方法数出天上的海鸥(四十七只)、冰上的海鸥(三十二只)、海豹(二十五只)企鹅(三十九只)、数并在情境图上出示(用大写)。

2、写数、读数

(1)师:对于这次南极考察,这可都是重要的数据,赶紧帮小科学家记下来吧!

找一名学生写在黑板上,其余写在练习本上,共同订正时,可以纠正一下写法。

(2)请板演同学读出写的数,评价后全体同学齐读。

在计数器上拨出以上各数。按老师要求一个数一个数拨出,注意订正反馈,每拨完一个数就大声读出来。

3、概括读写法则

师:(指板书)这些数同学们既会读又会写,真了不起,那你发现我们在读数和写数时有什么规律吗?

小组讨论,可以让学生在计数器上拨数,先读出,再写出,然后总结。(学生可能会答读写都是从左向右,也可能答先读写十位上的数,再读写个位上的数,)先肯定学生以上的说法,然后用计数器演示使学生明白,左边这一位是十位,十位上一个珠子表示“十”;右边这一位是个位,1个珠子表示“1”,左边这一位十位对于个位来说就叫“高位”)。所以我们读写时都是从高位起。

4、数的大小比较

(1)师:小科学家们还想弄清是天上的海鸥多还是冰上的海鸥多?是企鹅多还是海豹多?大家还能帮助解决吗?

学生独立思考后回答。

师:你是怎么知道的?

学生可能回答:47比32大,所以天上的海鸥比冰上的海鸥多。39比25大,所以企鹅比海豹多。

师:噢!只要比一比这两个数的大小就知道谁多谁少了。

教师板书47和32    25和39

(2)师:那你又是怎样比较47和32的大小的呢?

学生独立思考后回答。学生答案可能为:47比40大,以40为支点比较说明,32比40小,32不够40,加上一些才够,所以47大,32小。

以数的组成说明:47比4个十要多,32不够4个十。

可能根据数的顺序来比较:47排在32后面,所以47比32大。

对以上说法,都给予肯定表扬。并用同样的方法比较25和39的大小。

(3)师:怎样用符号把47和32连接起来,还能看出哪个数大哪个数小?

引导学生用“>”和“<”连接。教师板书:

47>32        32<47

师:你能用符号连接25和39吗?

学生回答后,教师板书:

25<39         39>25

(5)拓展延伸

师:(指板书)能否写出几个这样的式子?

学生口述,教师板书。

师:(指板书)仔细观察,看能发现什么?

引导学生用语言简单总结大小比较的规律。

(三)                    自主练习

1、做课本第1题写出计数器上表示的数,并读一读。

先让让学生表述出计数器每个数位上珠子的个数。独立填写,汇报答案。共同订正时注意纠正学生出现的错误,最后把所填数读出来。

2、做课本第3题填一填,比一比。

先表述出计数器每个数位上的珠子数,然后写出每个计数器上表示的数,比较出数的大小,最后填上“>或<”。

(四)                    概括总结及评价

师:这一节课你有哪些收获?

引导学生梳理一下本节课所学知识。

篇8

天津 300192

[摘要] 目的 观察17a α-D-高炔雌二醇-3-乙酯(DHEA)联合放、化疗对EC109食管癌移植小鼠的抑制作用及放化疗对荷瘤小鼠造血系统的防护作用。 方法 每只小鼠右侧腋窝下接种0.1 mL EC109细胞悬液,接种当天计为第1天。在接种后3 d,将30只接种EC109的裸鼠随机分为对照组、照射组、5-Fu组(25 mg/kg)、DHEA组、DHEA联合照射组、DHEA联合5-Fu组,每组5只。DHEA按照7.5 mg/kg剂量腹腔注射给药,0.2 mL/只,1次/d,连续9 d共给药9次。分别于第4天和第8天对照射组及DHEA联合照射组小鼠的肿瘤进行2 Gy局部照射。5-Fu按照25 mg/kg的剂量进行腹腔注射,0.2 mL/只,隔日1次,共给药4次。12 d后分别检测肿瘤抑制率、外周血细胞数、骨髓有核细胞数等指标。 结果 DHEA、DHEA联合照射组及DHEA联合化疗组瘤重均显著低于对照组[(0.34±0.02)g、(0.30±0.02)g、(0.23±0.02)g比(0.90±0.02)g,P < 0.01],DHEA联合照射组瘤重低于单照组[(0.30±0.02)g比(0.70±0.03)g,P < 0.05)]。DHEA、DHEA联合照射及DHEA联合化疗组单个核细胞数均高于照射组[(18.3±1.7)×106、(19.3±0.5)×106、(19.2±2.0)×106比(9.4±2.4)×106,P < 0.05]。 结论 DHEA联合照射或化疗对食管癌移植小鼠具有较好的协同抗瘤效果,DHEA对照射和化疗后荷瘤小鼠造血系统具有一定的防护作用。

[关键词] DHEA;辐射;5-氟尿嘧啶;食管癌;BALB/c-nu小鼠

[中图分类号] R811.5 [文献标识码] A [文章编号] 1673-7210(2013)11(b)-0004-04

The antitumor effects of DHEA combined with radiotherapy and chemotherapy on human esophageal transplanted carcinoma in nude mice

WANG Xinyan1 WANG Yueying2 WU Hongying2 LU Lu2 ZHANG Junling2 MENG Aimin2 LI Deguan2

1.Hangzhou Cancer Hospital, Zhejing Province, Hangzhou 310002, China; 2.Institute of Radiation Medicine, Chinese Academy of Medical Science & Peking Union Medical College Tianjin Key Laboratory of Molecular Nuclear Medicine, Tianjin 300192, China

[Abstract] Objective To observe the antitumor effects of 17-a-D-homo ethynyclestradiol-3-accetate (DHEA) combined with radiotherapy or chemotherapy and protective effect of DHEA on hematopoietic function in tumor-bearing nude mice. Methods EC109 cell suspension were vaccinated by 0.1 mL per mouse right armpit, the day of the first vaccination was selected to day 1. The EC109-inoculated nude mice of 30 were divided into six treatment groups as control, irradiation, fluorouracil (5-Fu), DHEA, DHEA combined with irradiation and DHEA combined with 5-Fu. The groups with DHEA were continuously delivered drugs for 9 days, with 0.2 mL/each,1 time/d, the groups with 5-Fu were injected in fourth and eighth day, the group with irradiation were given 2 Gy twice. 5 - Fu intraperitoneal were injected in accordance with the dose of 25 mg/kg, 0.2 mL/each, day 1, a total of dosing was four times. the tumor inhibition rate, the number of peripheral blood cells, bone marrow nucleated cell count were detected after 12 d. Results The results showed that tumor weight in DHEA [(0.34±0.02) g], DHEA combined with irradiation [(0.30±0.02) g] or 5-Fu [(0.23±0.02) g] mice were all significantly lower than those of control group [(0.90±0.02) g] (P < 0.01); the tumor weight in DHEA combined with irradiation group [(0.30±0.02) g] was lower than that of irradiation group [(0.70±0.03) g] (P < 0.05). The BMNC cells in DHEA [(18.3±1.7) ×106], DHEA combined with irradiation [(19.3±0.5) ×106] or 5-Fu [(19.2±2.0) ×106] group were all significantly higher than those of irradiated group [(9.4±2.4) ×106] (P < 0.05). Conclusion DHEA combined with irradiation or 5-Fu shows synergic effect on EC109-inoculated nude mice and protectes hematopoietic system from irradiation injury.

[Key words] DHEA; Irradiation; Fluorouracil; Esophageal cancer; BALB/c nude mice

[基金项目] 国家自然科学基金资助项目(编号81102873);天津市应用基础及前沿技术研究计划(青年基金项目)(编号12JCQNJC09100)。

通讯作者

随着经济发展,恶性肿瘤已升至我国疾病病死率第2位,仅次于脑血管病。现在临床肿瘤治疗主要以手术结合放、化疗等辅助治疗手段。在放、化疗过程中会损伤患者的免疫及造血功能,进而影响预后。提高肿瘤患者的免疫和造血功能,减轻毒副作用一直是肿瘤放、化疗亟需解决的问题[1]。17a α-D-高炔雌二醇-3-乙酯(DHEA)是一种新型辐射防护剂,本实验依据我国一类新药审批的要求[2],建立了食管癌EC109裸鼠移植模型。在此基础上观察单独使用DHEA、DHEA联合照射或者化疗对荷瘤小鼠的作用,为DHEA作为肿瘤治疗辅助用药提供新的实验基础。

1 材料与方法

1.1 动物和细胞系

BALB/c-nu裸鼠30只,8~12周龄,雄性,体重20~22 g,购买自中国医学科学院动物所,许可证号为SCXK(2009-0004)。

1.2 药物和仪器

DHEA是放射所合成的雌激素类辐射防护剂,白色粉末,无味。5-氟尿嘧啶注射液(5-Fu),购买自天津金耀氨基酸有限公司。Leica切片机(德国,LM2235),全自动血液分析仪(日本sysmex,poch-100i),奥林巴斯显微镜(日本,BX51)电子天平(梅特勒一托利多仪器有限公司)。137Cs γ射线照射源(加拿大原子能有限公司,Autocell40),剂量率为0.75 Gy/min。

1.3 EC109荷瘤小鼠模型的建立

收集处于对数生长期的EC109细胞,调整细胞浓度为1×107/mL。每只小鼠右侧腋窝下接种0.1 mL细胞悬液,并将接种当天计为第1天。

1.4 分组及给药

在接种后3天,将30只接种EC109的裸鼠随机分为对照组、照射组、5-Fu组(25 mg/kg)、DHEA组、DHEA联合照射组、DHEA联合5-Fu组,每组5只。DHEA按照7.5 mg/kg剂量腹腔注射给药,0.2 mL/只,1次/d,连续9 d共给药9次。分别于第4天和第8天对照射组及DHEA联合照射组小鼠的肿瘤进行2 Gy局部照射。5-Fu按照25 mg/kg的剂量进行腹腔注射,0.2 mL/只,隔日1次,共给药4次。

1.5 外周血细胞计数

在第12天,摘除小鼠眼球取血,K3EDTA抗凝,全自动血液分析仪计数。处死荷瘤小鼠取瘤体进行称重,按照公式抑瘤率(%)=(1-治疗组平均瘤质量/对照组平均瘤质量)×100%来计算抑瘤率。取单侧股骨,用1 mL PBS冲洗骨髓,得细胞悬液后用全自动血液分析仪计数。

1.6 病理学HE染色

取小鼠肿瘤组织后,4%甲醛溶液固定,随后脱水后石蜡包埋。将石蜡块用切片机切片后进行HE染色,中性树脂封片后,用显微镜观察并采集图像。

1.7 统计学方法

采用统计软件SPSS 15.0对实验数据进行分析,计量资料数据以均数±标准差(x±s)表示,采用t检验。计数资料以率表示,采用χ2检验。以P < 0.05为差异有统计学意义。

2 结果

2.1 DHEA对小鼠移植瘤的作用

与对照组相比,DHEA及DHEA联合照射组、5-Fu及DHEA联合5-Fu组瘤重均显著降低(P < 0.01),与单纯照射组相比,DHEA联合照射组瘤重下降,差异有统计学意义(P < 0.05)。DHEA联合5-Fu组瘤重低于单纯5-Fu组,两组比较差异无统计学意义(P > 0.05)。照射组瘤重低于对照组,但与对照组比较,差异无统计学意义(P > 0.05),提示DHEA联合照射组有较强的抑瘤作用。结果见表1。

表1 DHEA联合放、化疗对小鼠食管癌的抑制作用(x±s,n = 5)

注:与对照组比较,**P < 0.01;与照射组比较,P < 0.05;DHEA:17a α-D-高炔雌二醇-3-乙酯;5-Fu:5-氟尿嘧啶

2.2 DHEA对荷瘤小鼠外周血细胞及单个核细胞的影响

与对照组比较,DHEA及DHEA联合照射组、5-Fu及DHEA联合5-Fu组的单个核细胞数均显著升高(P < 0.05)。与照射组比较,DHEA联合照射组白细胞数(WBC)和红细胞(RBC)均显著升高(P < 0.05),DHEA联合照射组的血红蛋白(HGB)也有升高(P < 0.01)。与对照组相比,DHEA及DHEA联合照射组、5-Fu组及DHEA联合5-Fu组的WBC、RBC、HGB数量均有所升高,但差异无统计学意义(P > 0.05)。结果见表2。

表2 DHEA联合放、化疗对荷瘤鼠外周血及单个核细胞的影响

(x±s,n = 5)

注:与对照组比较,*P < 0.05,**P < 0.01;与照射组比较,P < 0.05,P < 0.01;DHEA:17a α-D-高炔雌二醇-3-乙酯;5-Fu:5-氟尿嘧啶;WBC:白细胞;RBC:红细胞;HGB:血红蛋白;PLT:血小板

2.3 肿瘤病理结果

小鼠肿瘤取出后,常规脱水固定,HE结果见图1。图1A为对照组肿瘤切片染色结果,表明对照组肿瘤形态不规则,未见规则结构。肿瘤外侧无包膜,与正常组织间无明显界限,呈浸润性生长。细胞呈强嗜碱性蓝染,为典型恶性特征。肿瘤细胞排列紊乱,大小不一,核异型明显,核浆比值增大,见核分裂相,核仁可见,中-低分化。照射组(图1B)肿瘤形态不一,细胞异型性明显,外侧无包膜,但与正常组织界限明显。肿瘤内有片状坏死,多见细胞凋亡,核分裂像少见。表明照射可诱导肿瘤细胞凋亡,抑制肿瘤生长。而在DHEA组小鼠(图1C),肿瘤细胞坏死明显增多,存在组织细胞机化,与正常组织界限明显。核分裂相少见,核浆比值增大,核仁少见。图1D为DHEA联合照射组,图中可见肿瘤细胞生长被明显抑制,具体表现为细胞形态规则,瘤内有正常细胞,外侧有包膜,与正常组织界限明显。肿瘤细胞大小均一,形态较规则,核浆比值增大,核分裂相少见,核仁少见,高-中分化。5-Fu组(图1E)肿瘤形态规则,细胞呈索状排列,瘤内有脂性空泡,与正常组织界限明显。细胞呈强嗜碱性蓝染,大小形态较规则,核分裂相少见,偶见巨细胞。图1F为DHEA联合5-Fu组,可见组织形态不规则,细胞异型性明显,外侧有包膜。细胞蓝染降低,大小形态不规则,呈现片状坏死,核仁不明显,核分裂相少见。

A:对照组;B:照射组;C:DHEA组;D:DHEA联合照射组;E:5-Fu组;F:DHEA联合5-Fu组;DHEA:17a α-D-高炔雌二醇-3-乙酯;5-Fu:5-氟尿嘧啶

图1 各组小鼠移植瘤的病理学检测(HE染色,100×)

3 讨论

食管癌是一种常见的消化道肿瘤,全世界每年有近30万人死于食管癌,我国每年死于食管癌人数约15万人[3-5]。目前临床对于食管癌早期诊断仍存在一些困难,大部分食管癌患者治疗时已是中晚期,自然病程仅6~8个月,因此放化疗成为食管癌临床治疗的主要手段[6-8]。

DHEA是放射所研制的炔雌醇类衍生物,前期研究表明DHEA对放化疗引起的造血免疫损伤具有预防和治疗效果,对小鼠多种肿瘤均有一定的抑制作用[9-11]。本实验利用荷瘤BALB/c-nu小鼠作为肿瘤模型,进一步观察DHEA对食管癌放、化疗效果的影响,探讨DHEA联合放、化疗治疗肿瘤的可能。

DHEA能显著提高对荷瘤小鼠EC109食管癌的放化疗损伤,抑制小鼠肿瘤生长,进而降低肿瘤生长速度,明显减轻瘤重。当DHEA与放化疗联合应用时,表明出良好的协同抗瘤效果,抑瘤率均高于照射组、化疗组和单独DHEA。对各组移植瘤进行病理分析发现,与对照组和照射组相比,DHEA联合照射组小鼠移植瘤组织与正常组织界限明显,细胞分化程度明显增高;与对照组和5-Fu组相比,DHEA联合5-Fu小鼠也有更好表现,提示DHEA联合照射或化疗对食管癌具有协同抗瘤效果。

在肿瘤发生发展过程中,肿瘤患者的免疫功能普遍低下,但当手术切除肿瘤,或放化疗后,免疫功能会进一步受损[12-15]。外周血象检测是常规的免疫检测指标。本实验检测了不同处理对荷瘤小鼠外周血象的影响。结果表明,与照射组相比,DHEA能显著提高荷瘤小鼠的WBC、RBC、PLT和单个核细胞计数,提示DHEA可以有效缓解受照荷瘤小鼠的外周血损伤,增强免疫功能。

总之,DHEA在抑制荷瘤小鼠食管癌细胞生长的基础上,还能够改善荷瘤小鼠造血功能,与放化疗联合表现出对移植小鼠肿瘤显著的协同抗瘤效果。本实验研究为DHEA在食管癌放化疗中的应用提供了新的实验依据。

[参考文献]

[1] 李墨林,李传刚,舒晓宏,等.化疗治愈荷瘤小鼠模型的建立及氟尿嘧啶抑瘤作用的免疫机制[J].细胞与分子免疫学杂志,2007,23(11):1010-1013.

[2] 卫生部药政局.新药(西药)临床前研究指导原则汇编(药学、药理学、毒理学)[M].北京:中华人民共和国卫生部药政局,1993:137.

[3] 吴再德.外科学-食管癌[M].7版.北京:人民卫生出版社,2011:349.

[4] 王小春,刘金剑,王月英,等.SKP2表达对食管癌细胞辐射敏感性的影响[J].国际放射医学核医学杂志,2012,36(2):103-106.

[5] Lin DC,Du XL,Wang MR. Protein alterations in ESCC and clinical implications: a review [J]. Dis Esophagus,2009,22(1):9-20.

[6] 刘泰福.现代放射肿瘤学[M].上海:复旦大学出版社,上海医科大学出版社,2001:355.

[7] Nakajima M,Kato H. Treatment options for esophageal squamous cell carcinoma [J]. Expert Opin Pharmacother,2013,14(10):1345-1354.

[8] Fokas E,Weiss C,Rodel C. The role of radiotherapy in the multimodal management of esophageal cancer [J]. Dig Dis,2013,31(1):30-37.

[9] 吴红英,王月英,张恒,等.17a α-D-高炔雌二醇-3-乙酯联合化疗抗肿瘤作用研究[J].陕西医学杂志,2012,41(11):1443-1444.

[10] 杜利清,孟爱民,王月英,等.DHEA联合γ射线对食管癌EC109细胞移植裸鼠的抑瘤与抗辐射作用[J].辐射研究与辐射工艺学报,2013,31(1):1-4.

[11] 王月英,王小春,吴红英,等.17a α-D-高炔雌二醇-3-乙酯联合γ射线照射对不同品系小鼠的抑瘤作用[J].国际放射医学核医学杂志,2012,36(2):97-100.

[12] Yang W,Yu J. Immunologic function of dendritic cells inesophageal cancer [J]. Dig Dis Sci,2008,53(7):1739-1746.

[13] Lippitz BE. Cytokine patterns in patients with cancer: a systematic review [J]. Lancet Oncol,2013,14(6):218-228.

[14] 刘柳,朴仲贤,沈志忠,等.食管癌细胞诱导肥大细胞迁移的小鼠模型[J].中国实验动物学报,2012,20(5):62-68.

篇9

关键词:0-1矩阵;统计匹配;剪枝

1 关联规则[1]挖掘及apriori算法概述

一提到关联规则挖掘就会令人联想到“尿布与啤酒”的故事,这是借助数据挖掘技术对大量原始交易数据进行分析揭示的一条规律。 apriori[2]算法是由美国学者r. agrawal等在1993年提出的一种从大规模商业数据中挖掘关联规则的有效方法。现在已经被广泛用于商业决策、社会科学、科学数据处理等各种各样的数据挖掘领域之中。使用基于支持度的剪枝技术,系统地控制候选项集指数增长。其核心是使用候选项集找频繁项集。算法具体的执行步骤如下:

(1)根据用户的要求确定最小支持度和最小置信度;(2)找出所有的频繁项集:先由数据库读入所有的数据项,得出候选1项集c1,然后根据最小支持度要求确定频繁1项集l1;使用l1与l1自连接产生候选2项集c2,继续对数据库扫描,得出候选2项集c2的支持度,确定频繁2项集l2;继续执行上述的步骤,不断进行连接与剪枝,重复对数据库的扫描,并和最小支持度进行比较,产生更高层次的频繁项集,直到不再产生新的候选频繁项集为止;(3) 根据频繁项集产生强关联规则。

2 apriori算法的缺点及改进方法

apriori算法能够有效地进行数据关联规则挖掘,但该算法存在效率不高的问题。该算法使用迭代方法,通过低维频繁项集产生高维频繁项集,该算法存在两个比较明显的缺点:一个是可能产生大量的候选集,时间开销和空间开销都很大;另一个是需要多次扫描数据库,需要很大的 i/o开销。

2.1 采用0-1矩阵描述数据库事务集

设i={i1,i2,…,in}是项的集合,d是数据库事务集,其中每个事务t是项的集合,使得t?哿i。按如下规则用0-1矩阵描述数据库事务集:如果i中某一项ik在事务t中存在,用“1”表示,否则就用“0”表示。数据库事务集d就转化为m*n矩阵的0-1矩阵,其中m为数据库事务集d 的大小,即包含多少个事务,n为集合i的计数。

采用0-1矩阵描述数据库事务集能带来如下好处:

(1)运算简单;便于统计,横向统计“1”的个数就是事务t包含的项数,纵向统计“1”的个数就是1项集的统计数;(2)使用0-1矩阵算法,提高统计项集时候的匹配效率,传统的统计匹配效率正比于n^2,采用0-1矩阵匹配时间效率正比于n;(3)减少对数据库的扫描,排序后,求频繁k项集的时候,统计项集时不需要扫描数据库,只需要统计包含大于等于k个项目数的事务;(4)易于对数据库事务集按事务包含的项目数大小降序排序;(5)易于求出最大频繁项集。

2.2 改进后的算法 myapriori描述

要提高apriori算法的效率,一般来说就是要考虑两个方面的问题:一是减少对数据库的扫描,二是在剪枝的时候减少统计项集的次数。采用 0-1矩阵,并排序以后,可以减少对数据库的扫描,在求k项频繁项集时候,只需要扫描包含大于等于k个项目的项集,不需要扫描全部的数据库。传统 apriori算法采用从频繁1项集开始,由频繁k-1项集产生频繁k项集,中间产生大量候选集,对这些候选集要进行统计并剪枝,运算量大;通过多次试验发现:对于1项频繁集,2项频繁集,……,m-1项频繁集,m项频繁集(m项频繁集为最大频繁项集),其数量分布有一定规律,就是两头的数量相对较少,尤其是最大频繁项集数量不多,中间频繁项集的数量较多,数量分布整体呈现为“纺锤状”。可以先通过统计的方法求出最大频繁项集,然后利用“频繁项集的所有非空子集一定也是频繁的”这一定理,再由k-1项频繁项集产生k项频繁项集时,剔除最大频繁项集的子集的项集,只需要统计分析剩余的项集是否为频繁项集即可,减少了剪枝的运算量,优化算法。算法myapriori:输入原始数据库事务集矩阵a,输出0-1矩阵fi表示的各项频繁项集。

上述算法的优点:在减少了剪枝的运算量,减少了数据库的扫描次数;缺点是对原始数据库0-1化处理、排序和统计产生最大频繁maxfi增加了额外开销,其中0-1化处理、排序要对数据库各扫描1次,统计产生最大频繁maxfi也

要对数据库进行扫描;其中0-1化处理、排序增加的开销并不是很大,统计产生最大频繁maxfi可能会带来较大的开销。总体来说,从时间效率上来讲,改进的算法优于传统的算法,尤其在maxfi比较容易求取的情况下;从空间效率来讲,改进后的算法要用到counta01、cca01、sa01等矩阵,效率会有所降低。

2.3 myapriori算法性能分析与实验

对某关于公积金数据库事务集{{t1:i1,i3,i4,i6};{t2:i2,i3,i4};{t3:i1,i2,i3;}; {t4:i2,i6};{t5:i2,i3,i4,i5};{t6:i2,i3,i5};{t7:i1,i2,i3,i4,i6}; {t8:i1,i3,i4,i5,i6};{t9:i1};{t10:i1,i5},令sup=0.3:

采用传统apriori算法,求1项频繁集时,有6个候选频繁项集,每个项集需要与原数据库匹配1次,原始数据库大小为10项,要匹配 6*10=60次,得到6个1项频繁集;求2项频繁集时,产生c62=15个候选频繁项集,每个项集需要与原数据库匹配1次,原始数据库大小为10项,要匹配15*10=150次,得2项频繁集有9项;求3项频繁集时,产生13个候选频繁项集,每个项集需要与原数据库匹配1次,原始数据库大小为10项,要匹配13*10=130次,得3项频繁集有5项;求4项频繁集时,产生3个候选频繁项集,每个项集需要与原数据库匹配1次,原始数据库大小为10项,要匹配3*10=30次,得4项频繁集有1项,4项频繁集即为最大频繁项集。在上述过程中,共计需要匹配的次数为:60+150+130+30=370。

采用改进后的算法myapriori算法,求1项频繁项集匹配60次,2项频繁项集匹配96次,3项频繁项集匹配76次,4项频繁项集匹配4 次,共计匹配236次,加上扫描2遍数据库,可近似计为2*10次=20次,总计为236+20=256次,小于传统apriori算法的370次;减少了对数据库的扫描和剪枝的运算量。

实验验证:采用matlab编程,2g内存,2.5g双核cpu, windows xp环境;使用gjj数据库,采用传统apriori算法和改进后的myapriori算法各运行10000次,时间分别为0.3440ms和 0.2950ms,可以得出改进后的算法更快。

参考文献

篇10

【关键词】 乳糜血; 血液分析仪; 标本

中图分类号 R446.1 文献标识码 B 文章编号 1674-6805(2016)24-0043-04

【Abstract】 Objective:To investigate the method for eliminating interference of chylemiaon on the main indexes of COULTER LH750 hematology analyzer.Method:Chyle blood samples which had been cleared by daily testing instruments was selected,they were detected and analyzed by one of the three methods of dilution,blank,replacement randomly within 2 hours mainly to analyze the 13 parameters of RBC,WBC,PLT,Hb,HCT,MCV,MCH,MCHC,NEU%,LYM%,MON%,EOS%,BASO%,a total of 95 samples were detected.The content of triglyceride of all experimental remaining specimens were tested by blood biochemical analyzer,specimens with TG0.05).The differences in Hb,MCH of chylous mild to moderate group before and after processing by dilution method were statistically significant(P

【Key words】 Chylemia; Hematology analyzer; Specimen

First-author’s address:Maternal and Child Health Hospital of Haiyan County,Haiyan 314300,China

doi:10.14033/ki.cfmr.2016.24.024

库尔特LH750是贝克曼库尔特公司一款比较经典的五分类血液分析仪,仪器工作原理为细胞计数采用阻抗法、血红蛋白为比色法、白细胞分类为VCS(容量、电导、光散射)原理[1]。鉴于血细胞分析仪特殊结构和分析原理,有很多因素影响仪器分析结果的准确性,如乳糜脂血、冷凝集、溶血因素等[2-3]。其中乳糜脂血是最常见因素之一,在日常工作中,如何发现这些干扰因素及采取相应的纠正措施保证检测结果的正确性,是实验室必须重视的问题,现对消除乳糜因素干扰细胞分析指标的研究报道如下。

1 材料与方法

1.1 标本来源

标本来源于2015年6-9月笔者所在医院门诊及住院患者,对照选择实验当天无溶血、无乳糜现象的新鲜标本。

1.2 仪器与试剂

血细胞分析使用Backman Coulter LH750血细胞分析仪,甘油三酯(TG)测定使用Backman Coulter AU680生化分析仪,试剂及校准质控均使用厂家配套。

1.3 方法

抽取患者静脉血2 ml置于EDTA-K2真空采血管,严格按操作规程检测,检测后标本室温静置30 min左右,选取血浆层明显脂浊的血标本。选取每日仪器检测后已明确的乳糜血标本,并在2 h内随机选择稀释、空白、置换三种处理方法之一进行再检测分析,累计检测标本共95份。实验选择的分析指标为白细胞计数(WBC)、红细胞计数(RBC)、血小板计数(PLT)、血红蛋白含量(Hb)、红细胞压积(HCT)、平均红细胞体积(MCV)、平均红细胞血红蛋白含量(MCH)、平均红细胞血红蛋白浓度(MCHC)、中性粒细胞百分比(NEU%)、淋巴细胞百分比(LYM%)、单核细胞百分比(MON%)、嗜酸性粒细胞百分比(EOS%)、嗜碱性粒细胞百分比(BASO%)。所有实验标本剩余血液经生化仪检测甘油三酯含量,并以TG

1.4 统计学处理

运用SPSS 18.0统计软件对所得数据进行统计学分析,计量资料以(x±s)表示,比较采用配对t检验,其中偏态分布的EOS%及BASO%数据经对数转换后统计,以P

2 结果

空白法、置换法、稀释法的轻中度乳糜组分别为9、5、8份,重度乳糜组分别为23、19、31份。各对照组处理前后检测指标比较差异无统计学意义(P>0.05)。轻中度乳糜组仅稀释法处理前后的Hb、MCH比较差异有统计学意义(P0.05);但重度乳糜组Hb、MCH、MCHC、PLT、EOS%三种方法处理前后比较,差异均有统计学意义(P

3 讨论

血液产生乳糜外观的主要成分是乳糜微粒(CM)、极低密度脂蛋白(VLDL),其中以乳糜微粒为最常见,其颗粒大小为80~500 nm,在血浆中呈乳浊状,主要由甘油三酯(TG)、胆固醇(CH)、磷脂及载脂蛋白组成的微粒体[4]。实验采用稀释、空白、置换3种处理乳糜血干扰的方法,与国内报道的添加脂肪乳的比对方法有较大差异[5]。因脂肪乳与乳糜微粒在成分、颗粒大小及均一性上均有所不同,实验结果可能有所差别。按照实验设计,笔者设立了每种方法的对照组,作为方法学验证,实验数据证实了三种方法的对照组在乳糜血处理前后的结果差异无统计学意义(P>0.05),表明三种实验方法学均可接受。在LH750血细胞分析仪上,Hb测定原理为比色法,遵守朗伯-比尔定律,仪器无法跟生化仪一样可以消去样本空白值来排除干扰,被检血中乳糜微粒虽经过试剂251倍的稀释及溶血剂的溶解作用来减少这种干扰,但高乳糜血对Hb的干扰还不足以完全消除,这种影响程度与乳糜严重程度正相关,实验结果也证实了这种干扰,三种方法重度乳糜组的Hb处理前后差异有统计学意义(P0.05)。国内也有报道指出TG含量在7.0 mmol/L时可对Hb等多项参数有影响,并且这种影响超出了仪器精密度范围要求[6]。血细胞计数的计数原理有电阻抗、鞘流电阻原理等[7]。库尔特LH750细胞计数采用电阻抗原理,拥有脉冲编辑和重叠校正专利技术的功能,可删除不规则脉冲和重叠颗粒的计数信号,能有效区分识别形态相对稳定的细胞群体,而乳糜微粒一般大小不等、颗粒不规则,所以乳糜血对细胞群形态稳定完整的WBC、RBC计数影响不大。而PLT由于体积大小不等的形态特性,大小与PLT相近的乳糜微粒可对其计数可造成一定干扰,由于LH750分析仪在PLT计数时血液要经6250倍稀释,因而PLT干扰仅在高乳糜状态下才显现出来,这也与实验RBC、WBC参数结果差异无统计学意义(P>0.05)、重度组PLT结果差异有统计学意义(P

三种方法处理乳糜血的实验比较发现,轻中度乳糜组结果仅稀释法的Hb、MCH比较差异有统计学意义(P

综上所述,乳糜血干扰血细胞分析的参数指标主要为Hb、MCH、MCHC、PLT,干扰大小与乳糜血严重程度正相关,稀释、空白、置换三种方法均能消除这类干扰,以稀释法操作方便、可检出较小的干扰而有较大的实用意义。

参考文献

[1] Coulter Corporation.Coulter MAXM with autoloader operators guide[S].1996,40-137.

[2]熊立凡,李树仁.临床检验基础[M].第3版.北京:人民卫生出版社,2005:50-51.

[3]郭利利,顾平.LH750血液分析仪的干扰因素分析及处理[J].山西医药杂志,2013,42(7):775-776.

[4]陈灏珠.内科学[M].第4版.北京:人民卫生出版社,1996:764.

[5]徐玉兵,高春芳,赵琳.脂血对Sysmex XE-2100D血液分析仪检测指标的影响研究[J].检验医学,2012,27(12):1017-1020.

[6]周窈佳.脂血对Sysmex XE-5000血液分析仪检测指标的影响[J].检验医学与临床,2014,11(2):206-207.

[7]伍柏青,傅新文.当代五分类血细胞分析仪技术原理分析[J].实验与检验医学,2011,29(4):391-392.

[8]曹寒沁,金胜航,吴敏瑾.乳糜血标本对血细胞分析仪测定结果影响因素的探讨[J].国际检验医学杂志,2014,35(13):1776-1780.

[9]张时民,张麟.乳糜血对血常规测定的影响及排除方法探讨[J].现代检验医学杂志,2010,25(5):72-75.