科技管理多维信息分类研究

时间:2022-05-14 05:12:59

科技管理多维信息分类研究

1政府科技管理决策及其信息服务需求分析

1.1政府科技管理相关概念及内涵

美国国家研究委员会(NRC)在其的研究报告中将科技管理定义为:科技管理是一个包含了科技能力的规划、发展和执行,并且用来规划和完成组织营运以及策略目标的跨科别领域[1]。科技管理的目的在于鼓励创新,促进经济成长和增进全人类的利益。政府科技管理决策是政府在履行科技管理职能过程中的一系列决定集合,贯穿于科技管理职能的每一个环节,是政府决策的重要组成部分。决策过程大致有确定问题、议程设置、政策形成、政策合法化、政策执行、政策评估等6个阶段,这6个阶段既包括决策者的决策行为,也包括决策后的政策执行和评估行为。政府科技管理是一项长期而复杂的行为,而科技管理决策的长期性、复杂性和层次性凸显了科学决策的重要性,也需要来源真实、渠道可靠、研究方法科学的信息支撑决策的制定过程。

1.2政府科技管理决策对信息需求及服务分析

1.2.1政府科技管理决策信息需求及服务模型。政府科技管理决策具有对象范围广、规模大、结构形态复杂、不确定因素多等特点,要求政府的科技管理决策必须建立在对现状充分了解、对决策预期充分估计的基础上,也即在充分掌握有效的基础信息和预测信息基础上进行政府科技管理决策。对于大多数属于非结构化的科技决策而言,需要是建立在对科技信息充分了解基础上,进行大量的信息分析研究才能提取所需的信息。在政府科技管理决策制定过程中,决策处于不同阶段所面临和需要解决的问题不同,不同阶段的决策行为与活动以及所需信息类型也不相同。然而不同决策阶段所需信息的加工流程基本相同,都需要经过信息的采集、整理、加工、服务等一系列过程[2]。本研究结合政府科技管理决策过程特点、信息加工步骤以及信息流方向构建政府科技管理决策信息需求及服务模型,如图1所示。图1政府科技管理决策信息需求及服务模型制定问题和议程设置阶段:利用实地考察、网络调研、问卷调查等方式对社会问题以及社会公众对政府行为的需要进行调查,搜集反映社会公众呼声的信息、突发事件信息以及与问题相关的专门社会信息等。政策形成阶段:对采集的信息整理、分析,提炼出有价值的知识资源,形成决策咨询报告、战略规划报告等信息,提出解决问题的方案。政策合法化阶段:采用政府信息推送服务,通过座谈会、听证会等形式了解社会公众对政策方案的意见与建议。提取社会反馈信息,并反映到决策方案具体实施方案中。选择一个方案,并寻求方案的政治支持,将方案纳入法律。政策执行阶段:追踪政策执行过程,搜集执行中产生的监测记录,生成政策结果信息。政策评估阶段:报告政府政策的结果,评价该政策对目标群体和非目标群体的影响,提出是否变革或改革。

1.2.2政府科技管理决策信息需求的特点

a.信息需求增多。当前,政府面临的问题日趋增多和复杂,偶然事件、突发事件时有发生,这使得政府决策对信息的依赖程度明显增加。同时,为了适应改革开放进一步发展的需要,政府部门,尤其是中央各部委进行了机构改革,政府工作人员的数量已大幅度减少,一些原来隶属于政府机构的研究部门也纷纷脱离政府编制。在这种状况下,政府部门仅靠内部力量很难完全满足其对信息的需求,因此对外部信息服务的需求便随之增加。目前,政府部门通常将需要解决的问题以各种课题和项目或特定信息需求的形式委托直属事业单位或者外包给社会单位机构来完成。对于政府机构,目前从外部及时获得较好的信息服务已经不是一件困难的事情。

b.高度重视信息的时效性和准确性。信息的时效性是指信息的时间价值,随着时间的延长,信息的价值在减少。这点在政府的信息需求中表现得比较明显。政府需要的信息首先必须及时,一些需要引起政府关注或有可能对政府决策产生影响的信息,如果不能及时提供,就错过了决策处理的最佳时机,失去实际意义,甚至有可能形成误导。有些信息,例如有关突发事件的信息上报的时间仅仅几小时,甚至是几分钟,就有可能产生十分不同的效果。而且许多突发事情需要政府决策的及时反馈,对民意进行疏导,以免产生恶劣的社会后果。因此信息的时效性是信心的价值所在。另外,政府部门对信息的准确性也高度重视,尤其在当前各种虚假信息、失真信息泛滥的情况下,信息的准确性对政府决策具有更为重要的意义。这要求信息提供者对政府所需信息具有敏感性,熟悉不同信息源,并能够根据信息本身所含的各种要素进行分析和判断。尤需注意的是互联网信息。由于互联网信息具有反映及时、来源广泛和数量巨大等许多独特优势,同时也由于大众的参与性,会被一些别有用心的人利用,所以既可以利用互联网的优势来弥补传统媒体或正式信息渠道提供信息的某些不足,又需要对互联网信息进行及时的反馈。目前互联网信息已引起我国政府决策部门的重视,并逐渐成为政府获取信息的一个来源。

c.针对性强、信息质量高。信息渠道的增多使政府可以获得的信息极大增加。但是过多的信息往往容易造成混乱,因此,政府部门更欢迎那些针对性强、信息含量高的综合性信息。这种综合性信息通常是由各领域的专业研究人员针对一些政府关心的重大或紧迫问题,在长期知识积累或占有大量信息的基础上经过分析研究提炼出的高层次信息产品。向政府提供的一些高质量信息有可能对政府的某项决策产生直接影响,它要求信息提供者能够进行换位思考,即从政府的角度确定提供什么信息和如何提供,并能透过现象看本质,挖掘信息的内在价值,使所提供的信息既有情况分析,又有对策建议。

d.信息涉及面比较广。由于政府的政治、经济、社会职能,其需要的信息所涉及的领域广泛,多属于跨学科问题,涉及到各行各业。提供这样的信息服务往往需要借助外部力量和集体思考,并需要进行深入科学的调查研究。

2科技管理决策支撑信息多维分类研究

运用层次聚类法,对科技管理类核心期刊内容进行划分,构造基于研究领域内容维度的分类表;运用比较归纳法对国内外科技管理部门、决策支撑部门信息分类进行归纳总结,找出共性和特点,形成多维分类表;同时运用专家意见咨询法选择具有代表性科技管理类期刊并对聚类结果进行咨询和人工干预,修正聚类结果,形成面向政府科技管理决策的信息多维分类表。

2.1分类表设计原则

面向政府科技管理决策的信息多维分类表设计不仅考虑信息服务对象的特点和个性差异,还需针对信息量大、内容庞杂,信息时效性强、类型多样,信息生产方法科学以及信息附加值高等特点。因此在设计面向政府科技管理决策信息分类表时要充分考虑新环境下的检索手段、方法、技术条件以及实际工作的需要,从多个维度对信息进行揭示。设计信息分类表时要遵循分类体系的实用性、自然性、科学性以及针对性4大原则。按照上述原则,参照学习《国际十进制分类表》《中国图书馆分类表》《中国科学院图书馆图书分类表》《中国人民大学图书馆图书分类表》《中国档案分类表》等在内的分类表的类别设置原则、类别标记方式方法和标记符号,针对政府科技管理决策对信息的需求及其特点,设计了面向政府科技管理决策信息的多维分类表的总体框架,如图2所示。在类表结构的设定上,《多维分类表》按照维度不同划分一级基本大类,再根据信息的特征从总到分、从一般到具体层层细分,形成完整的逻辑分类体系,其主表的类目最多细分到了三级。在分类表体系构建过程中,本研究使用维度、维的层次、以及维的取值表示分类表的结构。一级基本大类表示信息分类的维度,大类下属小类,逐级展开对信息进行分类标记。当小类有下一级类目时,称该小类为维的层次;当小类没有下一级类目时,称该小类的取值为维的取值。不同大类(也即不同维度)中维层次的划分根据信息属性的不同而有差异。如时间维、空间维、领域维、著作权属维等需要进行上卷及下钻操作,需进行层次的划分。在需要进行划分层次的维中,有的维具有多个层次,上下层次之间具有包含与被包含的关系,如时间维具有年、月、日、时、分、秒等层次,空间维有洲际、国家、地区等层次。在编码方式上采用数字和字符“•”方式组合编码。一级分类用00~99表示;二级分类用三位数字000~999表示;三级分类用四位数字0000~9999表示,依次类推,根据分类需要,每增加一级类目,数字表示位数增加一位。同时各级类目之间用字符“•”隔开,如00•003•0001。其中“00”表示按照领域维度划分信息资源,“003”表示科研管理,“0001”表示研究与开发。

2.2分类表生成方法

2.2.1层次聚类法。在进行层次聚类前,首先需要确定数据的来源、数据样本量的大小和数据类型。本文结合专家咨询意见,选取CSSCI管理类11种与科技管理、科技政策相关的核心期刊,并根据期刊影响因子进行从大到小的排序,选取影响因子最大的5种期刊作为本文的数据来源,最终确定的数据源列表如表1所示。根据上述期刊源从CNKI数据库中共检索得到6870篇论文。过滤掉重复的记录和征稿启事、会议通知等不相关论文,最终得到6499篇相关论文。由于下载的数据项(如作者项)不能直接进行统计操作,需要对此类数据项进行拆分、统计,按照词频大小进行排序,选取词频阈值超过定值的关键词来构造共词矩阵。本文经过反复的实践,最终设置词频阈值为30。词频大于等于阈值的关键词列表如表2所示。从表2中可以看出,部分关键词专指性不强(如“中国”、“基础研究”等),且对多维分类表没有实际意义,删去对聚类过程机会没有影响,因此,剔除此类关键词,最终确定聚类关键词为57个。构造共词矩阵M对共词矩阵进行标准化,以便消除量纲影响和变量自身变异大小和数值大小的影响。从平均数为u,标准差为σ的样本总体中抽出一个变量值x,用Z表示此变量大于或小于平均数几个标准差。由于Z分数分母的单位与分子相同,故Z分数没有单位,因此能够用来比较两个从不同单位总体中抽出的变量值。但将原始数据直接转换为Z分数时,常会出现负数和带小数点的值,实际使用起来很不方便。因此,在此情况下,可以对Z分数进一步加以线性转换,使之成为正的数值。最典型的一种分数线性转换就是T分数。

2.2.2基于案例分析的方法。聚类分析结果反映研究内容之间的类别关系,但仅基于文献内容关系维度对信息进行分类不能全面反映用户对信息分类的需求,且此种信息分类方法由于受到数据集的限制,在聚类结果的科学性方面需要进行补充。因此本研究选取国内外科技管理部门、科技决策支撑机构网站信息分类进行案例分析,发现实际工作中信息分类常用的维度,以及根据决策支撑信息特点和服务对象特点,形成多维分类表,对研究领域维度分类表进行补充。由于本论文研究针对政府科技管理决策所需信息的分类,案例分析对象的选择需要考虑政府科技管理和决策支撑机构两个方面的因素。政府科技管理部门是科技管理职能的实施者,同时也是决策支撑信息以及信息分类的需求者;决策支撑机构充当智囊角色,为政府科技管理决策提供智囊服务,而这种服务的直接体现形式就是信息服务,同时决策支持机构也是信息分类的使用者。

2.2.3基于专家意见咨询的方法。在探索建立分类体系的过程中,专家意见咨询发挥重要作用。如政府科技管理决策对信息及信息分类的需求、层次聚类数据源的选择、聚类关键词的筛选、聚类结果的人工干预以及多维分类表框架的专家意见咨询等。在进行专家意见咨询之前需要确定专家的数量、类型、专业背景等,以便顺利地完成所要解决的问题。本论文研究过程中综合考虑待解决问题的难度和涉及领域范围,最终确定选择专家工作经验在5年以上。同时对专家年龄、性别以及专家背景知识都严格要求,最终选定10位专家。在论文研究过程中,共邀请了中国科学技术部和中国科学技术信息研究所战略研究中心、情报方法中心的多位专家,就具体问题进行意见咨询。

3面向政府科技管理决策信息分类表

运用上述三种方法,生成基于文献内容的分类表和基于案例分析的分类表,分别对两张分类表进行专家意见咨询,调整类目设置,规范类名。最后将基于文献内容的分类表与基于案例分析的分类表融合,生成多维信息分类表。

3.1基于文献内容聚类分析结果

运用SPSS16对关键词T分数矩阵进行聚类分析,聚类结果以树形图输出,输出结果如图3所示。从图3中可以看出,各个类之间的距离在25的坐标内。由于样本或小类之间的距离差距较小,因此仅从图3很难清晰看出哪几个样本先聚类,但树形图可以直观地显示整个聚类的过程。文献的关键词反映文献的研究内容,而关键词之间的类别关系体现出研究内容主题的关系,因此把基于文献内容的计量分类命名为主题维。参照聚类结果,结合科技管理日常工作常用的名词术语对聚类结果进行标引,标引后主题维信息分类如6表所示。

3.2基于案例分析的多维分类

对表5中科技管理部门、决策支撑机构网站中与本研究内容相关的信息分类进行分析,尝试归纳总结分类特点,形成多维分类信息表。收到篇幅限制,选取美国科技政策办公室网站信息维度总结如表7所示。通过对国内外科技管理部门、决策支撑机构网站信息资源分类的调研,归纳和总结了各机构信息分类的特点,发现有以下几点特别值得学习和借鉴。

a.突出信息分类的实用性。各科技管理部门、决策支撑机构根据自己业务的开展和工作职能需要,从多个角度对信息资源进行揭示。例如,决策支撑机构信息分类包括研究领域或研究项目以及提供的决策支撑服务等,科技管理部门信息分类包括科技发展和科技政策等。

b.信息资源分类标引的准确性。各机构对信息分类标引准确,从分类标引中清楚地知道该类目所揭示的资源。

c.类级设置灵活。不同维度的分类结构可以灵活移植,例如,兰德公司的研究领域维揭示了兰德公司的研究领域和研究方向,当在揭示研究人员信息时,研究人员按照姓氏首写字母顺序排序,同时还可以按照研究人员从事的研究领域的维度进行揭示。

d.充分利用电子信息属性。电子信息不同于传统纸质文献信息,具有新的属性,如点击次数、浏览下载次数、IP地址地域性、以及知识单元间的超级链接等。随着计算机软件的发展,可以实现对电子信息新属性的及时统计,并能根据统计结果对知识信息进行快速排序。

3.3基于专家意见咨询的科技管理决策信息

多维分类在层次聚类形成的主题维分类表和案例分析形成多维分类表基础上进行专家意见咨询,根据专家意见对面向政府科技管理决策的信息多维分类表的维度和二级类别进行调整,重新确立多维分类表类目。面向政府科技管理决策信息多维分类表按主题维、时间维、空间维、语言维、载体类型维、信息格式维、体裁类型维、服务对象维、字顺维、权属维、浏览次数维、下载次数维、IP地址地域维等13个维度,多维分类表基本大类如表8所示。主题维:是按照电子信息内容进行归类,属于同一主题的决策支撑信息属于同一类别,主题可进一步细分。时间维:是指根据时间属性对信息进行分类,时间属性是信息的固有属性之一,其下级类目有年、月、日、时、分、秒等。按照时间维度可以实现信息的准确定位。空间维:是根据决策所要解决问题或研究问题所属地区来划分,其下级类目可按照洲际、国家、省份(郡或联邦等行政区划)来划分信息资源所属区域。与时间属性相同,空间属性也是信息固有属性。语言维:是指根据信息资源书写的语言种类作为检索信息的标识。国际上常用的语言种类有汉语、英语、法语、俄语、西班牙语等多种语言,语言维下级类目设置是开放式的,可以根据实际工作的需要进行扩充。载体类型维:是指根据知识信息的载体类型、形式来划分。通常有实物信息、书简记载信息、纸质记载信息、电子信息等几种类型。信息格式维:是指根据信息载体的种类划分决策支持信息资源。根据电子信息格式又可以分为pdf格式、word格式、Excel格式、ppt格式、视频等多媒体格式。体裁类型维:是指根据研究成果的展现体裁类型进行分类。按照体裁类型分别设置其下级类目,二级类目分别有研究报告、研究简讯、研究论文、专著等。服务对象维:是指根据科技管理决策支撑信息服务的对象进行分类。通常有机构、个人、部门等几种类型。权属维:是指根据知识产权和信息的产出机构来对信息进行分类。权属维下级类设置可以分为研究人员、研究成果等二级类目。研究人员可以按照首写字母顺序排序。字顺维:是指按照汉语拼音字母或者英文字母顺序等方式对信息资源进行组织。通常有按照汉语拼音字母顺序、英文字母顺序、偏旁部首顺序、天干地支顺序等多种方式对信息资源进行揭示。浏览次数维:是指根据信息被浏览的次数,按照从大到小的顺序对信息资源进行揭示。该维度反映用户对信息的欢迎程度或感兴趣程度。下载次数维:是指根据信息被下载的次数进行从大到小的循序对信息进行揭示。该维度反映信息资源的使用效率,下载次数越多,反映该信息使用价值越大。IP地址地域维:是指根据IP地址所属地域位置,对信息资源进行揭示。IP地址地域维与空间维不同,空间维是根据需要解决的问题的地域性或资料内容所反映问题的地域性对资源进行组织,而IP地址地域维则是根据浏览、下载的IP地址地域位置对资源进行组织。基本大类分类表从13个维度对面向政府科技管理决策信息进行分类,在细分表研制过程中,结合专家意见对面向政府科技管理决策信息分类基本大类表进行进一步展开,对类目名称及其含义进行说明,细分表如表9所示。

3.4细分表的使用方法

在实际工作中,需要将多个维度融合在一起对信息进行揭示,面向政府科技管理决策的信息多维分类表的维度可以灵活运用。使用方法如下:

a.按照细分表将信息资源分类,根据实际工作的需要,对信息资源进行标注。标注好的信息可以从不同维度进行检索。

b.分类表多个维度可以交叉使用。在运用该分类表对信息资源进行分类时,不同维度间可以交叉使用,互为对方的下级类目;不同维度的下级类目也可以相互之间交叉使用。

c.同一个维度内类目也可以交叉使用。在运用该分类表对信息资源进行分类时,在同一维度内的类目可以交叉使用,互为对方的下一级类目。

d.具有上下级关系的类目可以借助计算机实现下钻和上卷,平级类目之间先后关系可以调整。

e.部分维度对少量信息资源而言没有太大的使用价值,只有等海量数据积累起来后才能使用。(本文来自于《情报杂志》杂志。《情报杂志》杂志简介详见.)

作者:黄东流张旭刘娅工作单位:中国科学技术信息研究所