阅读次数:人次

Web数据挖掘与图书馆个性化服务

近几年,高校数字图书馆的发展速度非常快,其数据类型和总量也显著提升,数字资源覆盖多个领域,如电子图书、电子期刊、多媒体数据、海量的Web数据库等,这些数字化资源的出现为用户查阅资料提供了方便,但由于数据信息量大,用户在查找资料的过程中很难找准目标定位,因而会花费较多时间,而Web数据挖掘技术在高校数字图书馆中的应用则可以在很大程度上解决该问题。

1Web数据挖掘与数字图书馆的概述

1.1Web数据挖掘的概述

所谓Web数据挖掘,指的就是将有价值的、感兴趣的信息从大量的Web文档中提取出来,通常来说,可将Web数据挖掘划分为三种类型,即Web结构挖掘、Web内容挖掘和Web使用记录挖掘。其中,Web结构挖掘指的是从WWW的链接关系或者组织体系中推导出相关知识,通过文档之间的相互关系,WWW可以为用户提供文档内容之外的有价值数据信息,通过这些有价值信息,能够对页面加以排序,进而更好地发现其中的关键页面信息,整个Web结构挖掘过程需要用到HITS算法以及PageRank算法。Web内容挖掘指的是将相关知识从文档内容或描述中抽取出来,这项工作可被当作是基本搜索引擎所负责的工作的延伸,主要包括立足于数据库的挖掘以及立足于代理的挖掘两大部分。从性质上看,Web内容挖掘属于文本挖掘的一种形式,其作用的对象大部分是Web文档的文本区域,文本挖掘涵盖针对搜索工具的查询结果所开展的分析、整理、归类等工作。Web使用记录的挖掘主要针对的是Web日志以及Web使用数据,它能根据Web的访问记录直接定位到感兴趣的模式,Web日志的涵盖面非常广,主要包括服务器上与Web访问有关的各类日志文件,如代理日志、引用日志、访问日志等,其中涉及到用户的诸多访问信息,包括访问时间、访问途径、用户的IP地址、访问结果等。

1.2高校数字图书馆概述

随着信息化、网络化、数字化时代的到来,人们在工作和学习过程中对数据信息的需求量也逐渐上升,信息资源的类型及其表现形式越来越丰富,比较常见的主要包括电子图书、期刊等,在这样的时代背景下,数字图书馆也逐渐出现,它是以传统图书馆为基础的一种新型信息系统,它的主要功能是可以对文本、图像、数据、声音等多样化的信息进行采集、分析和整理,彻底颠覆了以往图书馆中采用其他非数字化介质来进行存储的落后方法。数字图书馆主要采用现代化的先进技术,把图书馆中的重要文献进行数字化存储,用户可以利用互联网在任意时间和空间查看信息,这就使图书馆的服务范围突破了时空限制,能为用户带来更多的方便,与传统的图书馆相比,数字图书馆具有多方面的优势,具体表现在以下几点:(1)相同的数据信息可在同一时间被多个用户查看,这就有效避免了传统图书馆中纸质书本只能在同一时间为一个人提供服务的缺陷。(2)数字图书馆的信息查询更加方便,它能为用户提供远程信息检索功能。(3)数字图书馆的数据信息存储空间比较小,其存储的数据信息能得到有效保护,不易被破坏。

2Web数据挖掘在高校数字图书馆个性化服务中的应用

2.1发现用户偏好,为其提供个性化的访问区域

Web站点在设计的时候大多是采用的同一种分类形式,也就是同一个页面内的分页面往往是按照其类别来组织的,用户在对Web站点进行访问的时候,可在很大程度上反映出其偏好,一般来说,用户在访问某页面时停留的时间越长或查看的字数越多,就表明该用户对这一页面的内容越感兴趣,对于不感兴趣的页面,用户停留的时间通常都比较短。对用户感兴趣程度进行计算一般采用的是收集用户浏览页面的时间信息及其途径等方式,这些信息能充分反映出该页面对用户的吸引力,进而便于系统按照用户的偏好,为之提供个性化的访问区域。

2.2识别高频率访问路径,提升图书馆资源的利用率

利用Web数据挖掘技术,能对数字图书馆中的高频率访问路径以及相关页面的重要页面进行精确识别,从而将一些关键的新书信息和分类信息放在经常访问的路径或者页面之上,便于用户找到所需信息,进而达到提升图书利用效率的目标。

2.3使链接结构得到进一步优化,为用户提供便利

Web数字挖掘在高校数字图书馆中的应用能促进链接结构的进一步优化,具体来说,主要表现在下列两个方面:(1)经过挖掘WebLog,可以了解到用户所访问的页面之间的关联,进而在具有紧密关系的页面之间加强链接,使用户更加快速地找到所需信息。(2)经过挖掘WebLog,可以精确地找到用户的期望位置,若遇到期望位置的访问次数比实际位置的访问次数更多的情况,则可以采取在实际位置与期望位置之间设立导航链接的方式来最大限度提升Web站点的优化效果。

3结语

总而言之,Web数据挖掘与当代高校数字图书馆的建设息息相关,为了提高数字图书馆的服务质量,最大限度满足用户的个性化需求,就必须学会科学地利用Web数据挖掘技术,把握Web数据挖掘的类型及其特征,使其在发现用户兴趣爱好、识别高频率访问路径以及链接结构优化等方面发挥出应有的作用,让用户在访问数字图书馆的过程中可以快速寻找到所需信息,充分感受到图书馆的人性化服务。

作者:孟玫 单位:南阳医学高等专科学校

参考文献

[1]欧阳烽.Web数据挖掘与高校数字图书馆个性化服务[J].现代情报,2008,28(01):103-104,107.

[2]欧阳烽.基于数据挖掘的高校数字图书馆信息资源管理[D].中南大学,2009.

[3]孙士新.高校数字图书馆个性化服务的应用研究[D].郑州大学,2009.

[4]陈雪.WEB挖掘在高校数字图书馆个性化服务中的应用[J].兰台世界,2008(24):73-74.

关于本站:中国最大的权威的公务员门户网站-公务员之家创建历经7年多的发展与广大会员的积极参与,现已成为全国会员最多(95.4万名会员)、文章最多、口碑最好的公务员日常网站。荣膺搜狐、新浪等门户网站与权威媒体推荐,荣登最具商业价值网站排行榜第六位,深受广大会员好评。

公务员之家VIP会员俱乐部

在公务员之家您可以分享到最新,最具有时事和代表性的各类文章,帮助你更加方便的学习和了解公文写作技巧,我们愿与您一同锐意进取,不懈的追求卓越。

如何加入公务员之家VIP会员
第一步:先了解公务员之家,查看VIP会员特权
第二步:银行汇款或在线支付,汇款即时到帐
第三步:汇款后立刻联系我们,将您的汇款金额和流水号告诉客服老师,3分钟内系统核查完毕并发送VIP会员帐号到您的手机中,直接登陆即可。

网站首页 | 关于我们 | 文秘服务 | 发表服务 | 支付方式 | 常见问题 | 联系我们