数据挖掘技术在高校图书馆中运用

时间:2022-10-08 05:44:38

数据挖掘技术在高校图书馆中运用

[摘要]阐述了数据挖掘技术的概念,提出了数据挖掘技术在高校图书馆中应用的必要性,并对数据挖掘在高校图书馆四个方面的应用进行了分析,旨在为高校图书馆个性化信息服务抛砖引玉。

[关键词]数据挖掘;高校图书馆

1数据挖掘技术

1.1数据挖掘技术概念

随着科技日新月异的发展,信息加工和处理也成为信息化的主要技术支撑,目前,许多领域的问题都是通过数据挖掘来解决的,数据挖技术在人们日常生活中应用也越来越广泛。数据挖掘技术帮助人们对各个领域的信息处理。数据挖掘是什么?目前,人们对信息需求远远大于过去任何一个时代,传统的统计工具无法满足现阶段人们的需求,数据挖掘技术也随着数字化、信息化的飞速发展应运而生。数据挖掘就是根据已有的不清晰、杂乱无章的海量信息,提取出所需信息的过程。通过数据挖掘,大量无规范的数据通过统计进行数据分类管理,从而将数据的规律和数据模式挖掘出来,并对未来数据的走向进行有效分析和预测。数据挖掘技术与很多学科领域相互交叉应用,涉及的知识面比较广泛,相比传统的信息处理方法,从表面上没有任何相互关联的数据中,挖掘出事情的关联原因,找出事物发展的规律,并用数据作为支撑,为决策者提供切实可靠的参考。

1.2数据挖掘类型

按照数据结构的方式来划分,通常可以分为文本数据挖掘、Web数据挖掘和数值数据挖掘。

1.2.1文本数据挖掘

文本数据挖掘,顾名思义就是从文本数据中通过计算机处理技术挖掘出有效、有价值的信息。文本信息挖掘主要包含两类,一是文本信息;二是文档类信息挖掘。数据挖掘的对象均为文本信息数据。文本信息挖掘方法主要有:文本分类、文本聚类、信息抽取、摘要及压缩。挖掘文本数据,主要包含对文本信息特征提取与文本信息分类、分析文本数据等。在对文本数据挖掘进行应用时,主要是以词串表示法、贝叶斯分类算法、词集合算法等技术手段为辅助,以便于完成信息数据相关工作。

1.2.2Web数据挖掘

Web数据挖掘,从字面上来解读,是挖掘技术在Web页面上的应用。包括针对Web数据等信息,如Web页面结构、用户信息等等信息数据,进行提取、优化页面设置,掌握访问用户的内容和行为。为用户提供更多优质服务,根据服务目的和内容的差异,对不同个体进行差异性的挖掘,具体包括挖掘Web日志、内容和结构。

1.2.3数值数据挖掘

数值数据挖掘,从字面上来看,主要是对数值数据的挖掘。主要的任务有描述数值数据和预测数值数据两种。数值数据挖掘功能为概念描述,重点进行分类分析和预测分析。常见的方法,有归纳法、模糊数学方法、遗传算法等。

2数据挖掘技术在高校图书馆建设中的必要性

2.1馆藏建设的需要

图书馆作为高校科研和知识的前沿阵地,它不仅拥有浓郁的书香文化氛围,丰富的馆藏资源也是必不可少的。现代图书馆,不光需要满足读者用户翻阅纸质书籍的需求,也需要满足数字资源的需求。现代科技和互联网的发展,改变了人们的阅读模式,便利、快捷的碎片化阅读成为人们首选的阅读方式。数字化阅读越来越受广大读者用户喜爱,人们可以通过搜索引擎迅速查阅到所需图书的相关信息,具有时效性和便捷性。计算机应用技术的发展在数据挖掘技术领域,结合图书馆原有的馆藏资源,分析馆藏已有资源,将纸质书籍做可视化处理,挖掘出信息数据中馆藏建设的优势和劣势,良好结合图书馆现有馆藏情况进行分析,将分析结果进行评估,这对丰富馆藏建设有着建设性意义。高校图书馆馆藏必须满足科研和学科需要,学生用户处于积累知识阶段,所需要的信息资源也是各种各样,对读者信息的挖掘,能够有效有针对性的节省开支,馆藏内容都通过数据挖掘技术来推算和评估,以供指导未来采购书籍和学科建设。

2.2满足用户多样化需求

高校图书馆的用户类型,主要是教师读者和学生读者。读者用户的不同,需要提供的信息也大不相同。这就要求图书馆对读者多样化需求进行数据挖掘,并根据读者用户的个性化需求来推送信息。首先,根据已知基本读者信息,得出不同读者的个性化需求。其次,分析不同读者信息需求和获取信息的多样化途径。最后,根据已有信息内容和信息获取方式,进行数据挖掘分析对比,从而实现因人而异的服务方式,提升图书馆信息服务质量。根据读者信息和访问等数据挖掘,可以反映出读者用户的需求,从而更好地服务读者。

2.3符合图书馆未来发展

现代高校图书馆的重要竞争力是数字图书馆,这一点符合“互联网+图书馆”的发展。高校图书馆的应用信息系统拥有大量数字资源,并通过网络技术等资源进行组织和整合,满足用户的需求。只有将大量数据资源和互联网关联信息进行有效的数据挖掘,才能挖掘出其中的最大价值,数据挖掘技术在图书馆信息化发展和信息服务建设方面有着无可替代的优势。

3数据挖掘技术在高校图书馆中的应用

3.1数据挖掘技术在文献推荐中的应用

文献利用率是考核高校图书馆服务质量的一项重要的指标,如何为读者用户提供可参考有价值的图书文献,做好文献推荐工作是高校图书馆个性化服务的重要组成部分。数据挖掘技术在图书馆借阅率中的应用,主要是根据读者用户进出图书馆的数据与借阅、浏览图书数据、进行分类分析与关联分析。通过数据分析,得出读者用户所借阅的数据与相关类别图书,呈现出一定的关联性,根据其中的规律,可以用于后台热点推荐和个性化推送。如读者在借阅卡耐基的《人性的优点》时候,又借阅了相关心理学书籍,说明这个读者喜欢书籍类型,具有一定关联,那么适当推荐心理学相关书籍、励志书籍给该读者,可以帮助读者节约查阅书籍的时间,提高对图书馆的利用率。

3.2可视化信息服务

数据挖掘技术比传统数据统计和表格更加清晰地体现出直观效果。人工智能技术和可视化设备大量引进图书馆后,图书馆不仅仅可以将读者借阅数据、馆藏数据、个性化偏好等数据,用直观可视化的图表清晰表现出来。还为图书馆建设提供一些参考。通过收集数据-数据挖掘-数据评价,将图书馆各项数据指标,实时记录高校图书馆各个部门人员图书借阅情况、到馆情况、读者密集度和习惯,用图表方式展现出来,为图书馆管理者提供服务和管理重要依据。

3.3阅读推广服务

高校图书馆阅读推广服务,为保证广大读者用户更加充分利用图书馆资源,激发读者兴趣,推广校园读书文化有重要意义。数据挖掘技术结合图书馆阅读推广活动,首先对读者用户的浏览图书馆界面和借阅记录进行数据采集,根据读者偏好,结合图书馆现有馆藏资源,筛选读者用户可能感兴趣的内容,并通过网络手段推送给读者用户;其次,根据搜索数据进行统计,如将热门关键词与馆藏资源进行数据信息匹配,以评价最好、热度最大等排列组合推荐给读者,如热门当红读者、出版社、话题最热等内容。再次,根据深度挖掘信息数据,找到相关规律,如世界读书日等热门节日,以这些为指标为读者推广工作提供一些依据。

3.4学科信息服务

高校图书馆的资源具有丰富的学术性特点,数据挖掘技术应用于图书馆,为学院发展、学科建设和服务提供了特色化服务。高校图书馆应主动结合用户的实际需求和专业特色,进行信息服务。如根据热点专业、精品课程、课堂研究等已有的内容,进行深度挖掘,使其具有更高价值,为读者用户提供的前沿研究领域和热点动态。如建筑行业高校图书馆,重点关注建筑设计、建筑工程、建筑设备、桥梁等相关领域前沿研究信息和动态,通过热点和馆内资源进行深度数据挖掘,为读者用户从海量数据中挑选出隐含的知识信息,为研究提供正确方向,实现学科信息服务功能。

4展望

数据挖掘技术在高校图书馆中除了在文中提到的文献推荐、可视化信息、学科信息服务、阅读推广工作中应用,在其他图书馆管理工作和建设中也应用得相当广泛。在图书馆未来发展中,数据挖掘技术还将进一步应用于信息服务中,服务于高校读者用户。如何做好数据挖掘工作关系到高校图书馆信息化的发展。

主要参考文献

[1]马婷婷,李涛.基于数据挖掘的高校图书馆信息服务.[J].信息与电脑,2017(22):145-151.

[2]杨建明,刘芳.基于数据挖掘的高校图书馆服务优化研究[J].情报与探索,2014(4):25-32.

作者:李雅 单位:湖南城建职业技术学院