个性化推荐系统十篇

时间:2023-04-01 00:47:38

个性化推荐系统

个性化推荐系统篇1

论文关键词:学习风格,Web挖掘,个性化推荐,AprioriAll算法

 

一、引言

基于Internet技术的教育网络化趋势不仅为学生提供了便利的学习方式和广泛的选择,也为学校提供了更加深入地了解学生需求信息和学生行为特征的可能性。但随着Web上信息量的爆炸式增长,网上的资源得到极大丰富的同时也充斥着大量的垃圾信息,当学生们面对这些庞大芜杂的信息海洋时变得无所适从,因而迫切需要能从这些纷繁芜杂的信息海洋中主动过滤并推荐给学生他们所需信息的个性化辅助教学推荐工具,本文就是针对这个问题而提出的。

目前人们利用数据挖掘技术,提出了许多个性化推荐系统。本文提出通过心理学量表对学习风格进行测试,并针对实际收集到数据的稀疏特点,采用项目评分预测的协同过滤算法[1](Item-Based Top-N推荐算法),尽可能准确地测试出学生的学习风格。然后结合Web日志挖掘技术,收集不同风格学生浏览网页的特点,通过AprioriAll算法求解频繁访问序列[2],得到不同风格学生的Web使用习惯,然后依据当前学生浏览页面向学生实时推荐下一步可能会访问的部分网页个性化推荐,提高学习效率。

二、个性化教学系统结构设计

根据WWW体系结构和网络学习系统的特点,需要采用一种新的设计框架来处理挖掘过程。作者采用挖掘学生历史浏览行为(记录在服务器日志中)和分析学生学习风格这两类特征来构建学生模型。

首次登陆系统时需对学生的学习风格进行测试,首先利用项目评分预测协同过滤算法(Item-Based Top-N)对未评分的项目进行评分,然后统计总分即可得到学生的学习风格类型这一特征值;对于己注册的学生则提取MFR路径(最大前引用)对Web服务器中的Web日志进行预处理,可得到学生最大向前向访问的路径,再用AprioriAll算法挖掘学生访问网页的频繁序列,把这一频繁序列作为特征值连同学生风格这一特征值进行数据预处理,即可得到学生个体兴趣模型,然后对其进行访问模式挖掘即可得到学习风格类型相同的学生所具有的访问模式,最后根据这一访问模式利用个性化推荐算法进行学习内容推荐。本文的系统结构设计如图1 所示。

图1个性化挖掘和推荐模块

三、 实现个性化教学推荐系统的关键步骤

1 构建学习风格及兴趣模型

学习风格是学生对学习方法的定向或偏爱,是学习者特有的认知、情感和生理行为,是学生持续一贯带有个性特征的学习方式。因此本文结合学习风格构建能代表学生特征的学生学习风格及兴趣模型。为了更加准确的测试出学生的学习风格类型,本文采用了所罗门风格量表和Kolb风格量表进行测试,由于学生数目的急剧增加和项目众多的风格量表导致学生评分数据的不完善,而产生了数据的稀疏性,这使得计算目标用户的项目评分后不能准确的测试出学生的学习风格。本文来采用基于项目评分预测的协同过滤推荐算法[1]计算项目间的相似性,预测学生对未评分项目的评分,就可以有效地解决数据稀疏情况下的学习风格的测试问题,能更加准确的测试出学生的学的风格毕业论文范文。具体实现如图2所示。

图2学习风格的测试流程

首先可以得到学生学习风格测评数据矩阵,假设用户为User-1,User-2,…,User-n,心理学量表的测量相目为Item-1,Item-2,…,Item-m,这样矩阵的形式如图3所示。

显然当缺少学生对某一些项目的评分时,量表就无法完成对学习风格的评价,在自主学习的环境产生这种现象中是很常见的。为此有必要填补学生未评分的部分,完成对学习风格的评价。作者通过两步来完成对未评分项目的填充:

 

用户\项目

Item-1

Item-2

Item-j

Item-m

User-1

R11

R12

R1j

/

User-2

R21

/

R2j

R2m

/

 

  …

User-i

Ri1

Ri2

/

/

User-n

/

Rn2

Rnj

个性化推荐系统篇2

关键词:电子商务;个性化推荐系统;信息过滤

中图分类号:TP393 文献识别码:A 文章编号:1001-828X(2015)015-000-02

一、引言

在虚拟的电子商务世界里,大量的商家把商品放在虚拟的网络空间,存在海量的商品信息在互联网上,对于普通消费者很难准确的找到对某个商家提高的商品非常感兴趣。用户也不可能花很多时间在浩瀚的网络资源世界里随意的去寻找自己所需,对于商品的信息用户也不可能像在现实生活的商场里一样进行实物比对。用户也无法知道商品的真正质量和品质。所以绝大多数的用户希望电子商务网站能够自动的为用户进行推荐,帮助用户在网上进行商品的挑选和购买,同时也希望网站提供其他购买商品的用户的一些评价信息,以便用户更好的了解商品的质量,根据相似或用户兴趣相同的用户进行推荐,满足用户在第一时间为用户推荐有效商品信息的需求。由于这一需求的用户量越来越多,电子商务个性化推荐系统也由此而生。

二、电子商务个性化推荐系统

所谓电子商务个性化推荐技术,即通过电子商务网站给前来访问的用户,提供一个人性化、个性化、方便、快捷的信息推荐,更加符合用户的兴趣偏好,推荐的形式多样,商品比对多样的个性化产品信息,以便用户采购商品。

电子商务个性化推荐系统一般来说,可以按主要的功能模块进行划分,通常包括用户输入模块和用户输出功能模块。输入可以是用户在登录该网站的个人信息注册,也可以是多个用户的注册信息的综合。客户个人输入主要是指目标用户,也就是说,要求建议,建议必须评估项目,将他们自身的爱好、隐式浏览和显示扫描输入、关键词以及项目属性及用户购买记录等充分表达出来。社区输入主要包含了项目属性、协会购买记录、评价内容等,是一种集体形式的评估数据。主要表达形式为建议,包括排序建议列表及建议列表排序两种,排序建议列表通常是参考用户的爱好为客户推荐具有吸引力的产品;预测系统的总体评估得分针对于一个给定的项目,个人得分,输出其他客户对商品的个别评级;对于商品的评级可以得出用户对该商品的兴趣度,文本输出也就是用户选购商品后的一组信息填写,一般会采用多种推荐算法的组合,亦或者计算机技术对数据收集整合的方式进行推荐,这个在推荐系统中占据着关键位置,直接影响着推荐系统的质量以及商品信息推荐的有效性。

电子商务推荐系统中拥有海量数据的信息资源,不同的网站可以在用户访问该网站时,通过cookie收集到各种用户的信息,并且根据用户在网站上选购商品的停留时间,可以判断用户的兴趣喜好,记录用户的信息并为用户提供有效的信息推荐。电子商务个性化推荐系统还可以不断的更新发现用户的新兴趣,根据用户注册时候所填写的资料,自动跟踪用户的购买行为习惯,及时发现用户兴趣的变化。当系统的产品库和用户兴趣的信息变化,自动推荐的序列变化,极大地促进了用户浏览商品信息,并提高服务水平。

三、电子商务个性化推荐系统结构及检索过程

电子商务个性化推荐系统的形成起源于每个人的兴趣爱好不是独立的个体,而是属于某种或某个群体。人们在日常生活中所获取的信息多数都是通过他人的引荐得到的。所以按照类似兴趣或完全相同的用户爱好进行相对的信息评价与了解,再向周围人群推荐。根据电子商务个性化推荐系统的结构如图1所示,首先通过用户对信息的评价与了解状况,将用户划分为不同的类别,如:兴趣相同或类似的用户为一类;用户推荐制度主要是通过对类别内外因素的综合影响进行考虑,按照不同的影响程度将信息推荐给相应的用户;通过用户的评价和了解,对用户类别进行相应的调整,对各类参数做出相应的修改,从而将过滤效率不断完善。信息过滤推荐主要是参照用户相互推荐的情况进行,通过对相同或类似用户的正确判断,保证信息推荐的相关性,从而避免无效信息的干扰。

图1 推荐系统整体结构

信息过滤系统的性能,关键在于过滤模型的完善程度如何。个性化推荐信息系统的过滤工作主要包含了以下几方面:第一,用户的评注和分类机制;第二,用户的推荐机制,结合类别的内外评注信息向用户进行推荐;第三,反馈机制,对用户类别和参数进行不断调整。根据对合作模式的文本过滤中,过滤的结果会根据用户的评注进行判定。而用户评注主要是通过评分的方式决断,根据用户的爱好以及评分标准,为浏览的信息评定相应的分数,评分采用百分制。用户判断分数多少一般都是通过其他用户相同或类似爱好的用户推荐进行的,这样的合作不仅可以避免无效信息的干扰,还能够有效提升过滤系统的精准度。任何用户在合作的状态下都会受类内和类外因素的影响,所以用户可以通过对其他用户的评注信息判断用户爱好和信息之间的关联程度。由于合作模式的文本过滤模式主要是通过用户相互间的推荐形成的,并非是由信息内容形成,所以,在很大程度上减少了系统对信息进行分析时的困难度和成本浪费现象。这种方式不只在文本信息过滤方面受到应用,同样也可以运用到信息推广和推荐方面。推荐系统应注意与用户分类和推荐有关的规章制度,将用户合理的组织在一起,通过对用户爱好的了解进行分类划分,明确制定合理的推荐方式,从而更好的保证信息过滤推荐的有效率。

对文档是不是满足用户的需求进行判断时,可以利用新文档的向量以及对文档的相似率进行过滤来做出决断。

对电子商务个性化推荐系统全面运用时,必须充分结合人们通过过滤过程中的心理和行为状况,过滤机制应充分按照人类的心理和行为活动设置,那就需要先成立知识库,通过对用户过滤主题的了解成立相应的知识库,知识库主要包含了主题文本的主要特点,如:关键词、相关概括以及特殊语句等。然后利用知识库中的特殊语句、相关概括或者关键词对文本中的词汇进行统计和权值运算,完成首次过滤。同时要对相关主题的语句进行深入分析,明确文本中的关键词语所在。最后通过文本信息主题中关键词语和用户给出的过滤主题对比,确定用户的要求得到全面的满足后,做出最后的决断。

四、总结

电子商务个性化推荐系统与传统的网站销售系统,他们既有不同也有相似的地方,他们都为各自的供应链管理提供了企业的决策支持信息数据。传统的销售系统只是单纯的帮助销售人员进行商品销售,然后如何将产品有效地推荐给有需求的用户,电子商务个性化推荐系统就可以很好的解决,帮助用户决定购买什么样子的商品。供应链决策支持系统是帮助生产商生产产品时,某些产品和多少应该存储仓库,最终目标是生产者为企业服务。一般个性化推荐系统主要是针对来访的,有采购需求的用户进行有效商品信息推荐。

电子商务个性化推荐系统好比一个虚拟的销售人员,它帮助和引导用户进行商品的选购,对比。它可以为用户提供真实可靠的商品信息推荐。电子商务个性化推荐系统不仅能够对用户的反馈信息进行全面收集,同时还能统计用户对该商品的访问次数,来确定商品信息的可能感兴趣的潜在用户,比如用户浏览该网站的日志记录,购买的商品时间等等。通过过分活跃的商品购买记录和用户的购买兴趣和访问商品信息的时间等,来给用户进行提供有效的推荐信息。

根据相关的网络调研发现,使用个性化推荐系统最多的就是电子商务网站的各类商品销售。特别是在书籍,电影,音频和视频产品,日用百货、和其他产品相对较低,各种各样的商品,使用高度的个性化推荐系统的行业,推荐系统可以极大地提高企业的销售。当信息个性化受到用户越来越广泛的关注后,电子商务此时应由被动变主动,不要再一昧地等待客户,要积极主动的为用户提供个性化服务,秉承以客户为中心的思想理念。

参考文献:

[1]马小龙.基于协作过滤算法的电子商务个性化推荐系统的研究.微型机与应用,2014,15:13-15,25.

[2]孙彦超,韩凤霞.基于协同过滤算法的个性化图书推荐系统的研究.图书馆理论与实践,2015,4:99-102.

个性化推荐系统篇3

关键词:实时推荐系统;R语言;BP算法;FP-tree关联规则算法;商品时效

DOIDOI:10.11907/rjdk.161723

中图分类号:TP319

文献标识码:A文章编号:16727800(2016)010012303

0引言

近几年来,电子商务推荐系统发展迅速,个性化及多样化的推荐系统为企业带来了丰厚的利润。有研究表明,电子商务零售行业提供个性化推荐服务后,其销售额会提高2%~8%[1]。目前推荐方式主要有:协同过滤推荐、基于内容的推荐、基于知识的推荐、混合推荐。随着大数据时代到来,数据量急剧增长以及用户多样性的需求对推荐系统的实时性提出了更高要求。因此,更有效、更多样性的实时推荐系统已成为电子商务领域研究的热点之一。

1实时推荐相关技术

在提高电子商务推荐系统实时性的问题上,国内外专家学者研究出一些切实可行的解决方案,其中主要包括云计算技术、Cookie技术、站外广告推荐技术等。

1.1基于云计算的实时推荐技术

国内著名的电子商务平台阿里云主要采用云计算[2]推荐方式,它是基于先进的云计算系统,支持海量网页数据和用户行为数据的分析计算,从而可以在很短时间内完成对大量用户数据的分析及计算,从而达到实时推荐的目的。目前运用较多的基于云的实时推荐框架主要有Spark框架、Kiji框架和Storm框架3种[3]。一定程度上,这些框架都是通过缩短模型训练时间,从而提高实时推荐速度。

1.2基于Cookies的实时推荐技术

基于Cookie的实时推荐是将Cookie技术与模式识别算法相结合,根据用户与相关站点、内容或服务互动时所提供的信息,实时捕捉用户兴趣偏好,然后在电子商务平台所有站点以及其它站点上显示以兴趣为基础的广告。亚马逊电子商务平台就使用了这种推荐方式,使得企业可以快速了解用户浏览了哪些广告、点击了哪些广告,以及追踪用户在各种站点上进行了哪些操作,以便收集用户的站点操作数据,并实时分析用户的兴趣偏好,为用户提供更有效的推荐。

1.3站外广告推荐的实时推荐方式

随着Web2.0技术发展的成熟,许多电子商务网站都采用了站外广告推荐,它们采用将推荐广告投放到其它网站的方式进行实时推荐,当用户浏览某门户网站时,会发现网站上投放的广告会是不久前搜索过的商品。这种推荐方式使用户浏览网站的同时可以点击了解自己心仪的商品详情,这样做既符合用户心理,又可提高商家的销售额。

1.4存在的问题

综合以上3种实时推荐方式发现:云推荐系统搭建成本很高;基于Cookies技术推荐方式存在较大的用户隐私泄漏风险;基于站外广告投放的实时推荐方式,相对而言其成本较低,运用也很广泛,但目前该平台是基于社会广告的投放方式,在推荐时根据用户搜索过的商品进行实时推荐,会造成推荐浪费,即:用户通过推荐购买了推荐的商品,下次仍出现相似甚至相同商品的推荐,但对于一些商品,用户在短时间内,一般不会购买同样商品,而更愿意看到更多样化的商品实时推荐。

2系统框架

为解决实时推荐系统推荐效率不高、推荐商品多样性不强,造成企业推荐成本浪费并影响用户满意度的问题,本文重点对用户历史行为数据进行研究,运用挖掘算法挖掘用户购物商品的特征属性,根据每位用户对应的商品特征属性集合,为用户制定个性化的实时推荐。本文所设计的推荐系统主要创新点就在于可以追踪用户在一段时间内所购买商品的特征属性,为用户制定更有效、更多样的商品实时推荐。推荐系统框架如图1所示。

如图1所示,本文设计的个性化实时推荐系统框架主要包括以下3个部分:数据预处理、数据挖掘、实时推荐,其中实时推荐是推荐系统的核心部分。本文采用基于FPTree关联规则的推荐模型[4],并在其基础上提出建立商品时序推荐模型,根据商品的特征属性设定主动推荐商品的时序。例如,对于服装类商品,用户在购买搜索过的商品后,通常在很短时间内不会重新购买类似产品,此时可将此类商品推荐时效后延,保证推荐的多样性和新颖性。

3系统实现

3.1数据预处理

本文运用R语言工具对收集的输入数据进行预处理,R语言是一个用于统计计算和统计制图的优秀工具,具有一套完整的数据处理、计算和制图软件系统[5]。对用户购买商品的历史表格进行统计,按照用户ID统计购买对应的商品信息,然后对数据进行筛选,检查数据类型是否统一,是否存在明显的数据错误。另外,从服务器上收集的Web日志数据也同样需要进行处理,一般Web数据预处理主要包括数据融合与清理、用户识别、交互识别、路径完善阶段[6]。

3.2基于商品特征属性的数据挖掘

通过以上两个阶段的数据预处理,“脏数据”[7]已基本被清理干净。利用电商平台提供的商品分类表及商品对应的属性编码库,整理并统计出每位用户在最近一段时间的购物情况表,然后运用数据挖掘方法探究商品的哪些属性影响用户购买行为。本文主要采用BP神经网络算法[8]对数据进行训练并挖掘出商品属性中影响用户购买行为的特征属性。

现假设用户集合为Q={q1,q2,q3…qi},其中qi表示第i个用户的属性集合;商品集合为X={X1,X2,X3…Xi},其中Xi表示第i种商品的属性集合,每种商品具有相应的属性值,用xij表示第i种商品的第j个属性编码值;用0、1标记已购买和未购买两种行为,则yi={0,1}。本文随机抽取了一部分用户历史购物情况数据,其中包括一定量的正例和反例两种样本数据。

神经网络模型结构主要包括:节点输出模型、作用函数模型、误差计算模型、自学习模型。其中,作用函数模型:f(x)=11+e-xx∈(0,1),反映下层输入对上层节点刺激脉冲强度;自学习模型:Δwij(n+1)=h*δi*oj+a*Δwij(n),h为学习因子,δi为输出节点i的计算误差,oj为输出节点的计算输出,a为动量因子。

运用以上模型训练数据后,可挖掘出商品属性集合中有几种属性对用户购买行为发生的权重较大,将这些权重较大的属性提取出来即为特定用户偏好的商品属性,即商品特征属性。当然每位用户因为购买的商品不同,其商品特征属性也是不相同的,因此针对不同的用户,需不断通过神经网络模型来挖掘其特征属性集合。

3.3基于商品特征属性的实时推荐

假设提取商品的特征属性值的集合为P{p1,p2,p3…pi},从每位用户对应的商品特征属性集合,就可基本掌握该用户的购物偏好。例如,商品特征属性中若包括单价,则该用户购买商品时应比较看重商品单价这一因素,可根据其购买商品的平均价格为其进行实时推荐。本文通过对挖掘出的商品的特征属性集合进行研究,根据相关文献[8]提出建立基于商品特征属性的关联规则模型及基于商品时效属性的推荐模型。

3.3.1基于商品特征属性关联规则的推荐模型

基于关联规则的推荐模型也属于经典的推荐算法之一,其主要优点在于可以提高推荐结果的多样性。将这一算法运用于探索商品的特征属性集合的关联规则,可为用户提供更为精准多样的推荐,提高用户满意度。

已知用户所购商品的特征属性值的集合为P{p1,p2,p3…pi},则可结合用户购物情况表,可提取出用户所偏爱购买的商品记录。假设存在如下购物记录{a,b,c,d;a,b,c;d,e;a,c,d,e;e,f;d,f;a,b,c,d,e,f},运用FP-tree关联规则算法进行频繁项集的搜索,首先对数据库扫描一遍,将其中的频集按照关联的方式生成一棵频繁模式树(FPtree),随后将其划分,形成若干条件库,每个库都和长度为1的频集相关,最后分别对具体的条件库实行挖掘。在用户购物时,该关联规则推荐模型可为用户推荐其感兴趣的产品及其相关产品,提高实时推荐的多样性,从而进一步提高用户满意度,达到留住客户的目的。

3.3.2基于商品特征属性的时序推荐模型

为提高实时推荐效率,在基于商品特征属性关联规则的推荐模型上,考虑商品属性的时效性。商品时效是指商品可被使用的一般时长或者为用户对某种商品的喜好时长。根据一般购物经验,用户在接受某个商品推荐后即购买该产品,短时间内若系统多次向其推荐相同或相似商品,则用户购买的兴趣度会大打折扣,甚至可能会拒绝推荐,从而影响实时推荐效率。

本文主要以电子商务领域中涉及到的衣、食、用为研究对象。不同类别的商品所对应商品的时效不同,因此本文在商品属性关联规则推荐的基础上,提出建立基于商品特征属性的时序推荐模型。假设挖掘出涉及衣、食、用这3个方面的商品类别属性集合分别为N{n1,n2,n3…ni}、M{m1,m2,m3…mi}、O{o1,o2,o3…oi},设推荐时效权重值集合为Wj={w1,w2,w3…wi}。

本文结合一定的统计信息及相关的专业领域知识,为商品设定以下几条时序规则:①在用户可接受价格的范围内,畅销类品牌的食品、服饰、日用品优先推荐,即在进行关联规则推荐时,为这类商品及其相关商品设定较大的权重值Max{wi},使其排序靠前;②对于用户在短时间内购买过的食品,可根据其含量及专家建议食用意见,给予定时推荐,即实时推荐,时间间隔T一定,T值大小由商品用途及含量决定;③对于用户购买过的同类服饰,可在一定时间内不予推荐,即推荐时权重值设定得较小或直接滤过,另可结合当前用户所在地区的天气情况,给予每日主动推荐;④与人类健康有关的用品,结合领域专家的意见定时推荐[10],如内衣、牙刷、抹布等。

这些商品时效推荐规则构成了商品时效推荐模型,在搭建好实时推荐平台后,运用这一模型可为用户带来专属的个性化实时推荐。

4结语

本文通过研究用户购买商品的数据,提取出商品的特征属性,并将其作为主要研究对象,探索用户购买商品的偏好,提出建立基于商品特征属性的个性化实时推荐系统框架,在一定程度上可以有效捕捉用户的购物偏好,并可为用户提供推荐效率更高、多样性更加丰富的实时推荐,具有较强的智能性、实用性。但其也存在一些不足,主要表现在商品实时推荐模型中的规则很简洁,后续可深入研究。

参考文献参考文献:

[1]ZAIANE.Building a recommender agent for eleafing systems[C].2002 International Conference on Computers in Education,2002:5559.

[2]应毅,刘亚军,陈诚.基于云计算技术的个性化推荐系统[J].计算机工程与应用,2015(13):111117.

[3]陈敏敏,王新春,黄奉线.Storm技术内幕与大数据实践[M].北京:人民邮电出版社,2015.

[4]卢健,刁雅静.Web日志挖掘中的数据预处理研究[J].江苏科技大学学报:自然科学版,2012(1):8185.

[5]NORMAN MATLOFF.R语言编程艺术[M].陈堰平,邱怡轩,潘岚峰,等.译.北京:机械工业出版社,2013.

[6]刘华,张亚昕.基于FPtree算法的推荐系统设计与实现[J].电子设计工程,2015(2):8184.

[7]朱智林,左天军,牛淑龄.基于日志的脏数据检测与恢复[J].电子科技,2004(5):912.

[8]刘钊,蒋良孝.基于神经网络的数据挖掘研究[J].计算机工程与应用,2004(3):172173,190.

个性化推荐系统篇4

关键词:推荐算法;负面评价;物质扩散

中图分类号:TP312文献标识码:A文章编号:1009-3044(2012)03-0611-03

Frame Research of Personalized Recommendation Algorithm by Considering the Negative Ratings

SU Ying

(Business School, University of Shanghai for Science and Technology, Shanghai 200093,China)

Abstract: This paper introduces new recommendation algorithm frame by reconsidering the negative ratings. The numerical results based on MovieLens dataset and the mass-diffusion-based algorithm show that,the new algorithm frame can greatly reduce the redundancy, and also enhance the accuracy and improve the quality of the recommended results.

Key words: recommendation algorithm; negative ratings; mass diffusion

如何准确识别用户的需求,帮助用户找到自己真正需要的信息成为信息过滤技术的一大挑战。为了解决这些问题,推荐系统,也称为个性化推荐应运而生。个性化推荐系统被认为是信息爆炸时代解决信息超载问题的最有效的信息过滤手段。个性化推荐系统是建立在海量数据挖掘基础上的一种高级智能平台,通过记录用户的网站使用足迹,挖掘用户的兴趣特点,向用户推荐其感兴趣的信息或商品,为用户提供完全个性化的决策支持和信息服务,满足用户的个性化需求,改善用户体验。近几年,各种各样的推荐系统被广泛研究和应用,经典的推荐算法包括协同过滤算法,基于内容的推荐算法,基于网络结构的推荐算法和混合算法等等。

然而,目前对个性化推荐算法的研究都关注利用用户喜欢产品的信息预测可能感兴趣的产品,而用户的负面评价信息则没有引起重视。本文重新考虑了在很多推荐算法研究中被忽略掉的用户的负面评价信息对推荐算法改进的意义,构建了考虑负面评价的个性化推荐算法框架。

1负面评价对推荐算法改进的意义

现实中应用的推荐系统一般都会向用户提供一个统一的评价体系,方便用户对产品进行评价的同时,还可以使评分数据标准化统一化。几乎所有系统的评分数据都可以大致分为好评和差评两类:好评数据隐含了用户的偏好特征;差评数据隐含了用户的不喜欢产品的特征。以往的推荐算法研究中都会清洗掉用户的负面评价,但我们认为负面评价对于推荐系统具有重要意义,具体表现在以下三方面:

1.1利用负面评价可以减少数据稀疏给系统带来的负面影响

实际系统中收集的信息,常由于用户不愿意透漏自己的隐私等种种原因,严重缺省。随着维度增加,数据在它所占据的空间中将越来越稀疏,最终导致具有统计意义的数据样本稀少。推荐算法依赖于用户的历史数据,一般来说历史数据越多,系统的推荐准确度相对越高,因此数据的稀疏问题将直接影响系统的推荐质量。忽视用户的负面评价信息在一定程度上增大了系统的数据稀疏性,不利于算法的运行。我们认为用户的负面评价信息有助于降低系统的数据稀疏性,可以有效缓解数据稀疏带来的各种问题,因此用户的负面评价信息应该得到研究者的关注,并将其合理地用于改进推荐算法。

1.2负面评价可以帮助系统更准确地定位用户喜好

现有的推荐算法或者利用所有评分数据,忽略用户评分数据的高低差异,或者只利用用户正面评价的产品信息,清洗掉用户负面评价的产品信息。用户或产品相似性网络的构建过程中也都只考虑基于正面评价的信息,比如协同过滤算法,总是从偏好出发去搜索相似的偏好;基于网络结构的推荐算法,也只利用用户的喜欢信息去建立二分图网络。在很多情况下,忽视用户负面评价信息会影响推荐系统对用户兴趣点定位的精确度。如对于一部正在热映评价尚好的电影,有一小群用户打了低分,那么他们差评的 理由可能会非常相似,而对于打高分的大多数人来说,好评的原因却可能相差很远,比如,这些人中可能存在着盲从的随大流的评价者,他们的评价可靠性差,推荐能力很弱,难以刻画出用户的兴趣点。实际应用中,用户一般更倾向于进行正面评价,负面评价一旦出现就意味着用户的厌恶情绪鲜明强烈,因此我们认为用户的负面评价信息可靠性更高,可以帮助系统更准确地把握用户的兴趣特征。

1.3利用负面评价信息可以有效减少系统中的冗余信息

随着网络用户数量与产品种类的增加,推荐算法的扩展性问题将成为制约推荐系统发展的重要因素。数据量的急剧增加将给系统存储、更新带来越来越大的成本压力。随着计算规模和复杂度逐渐增大,推荐算法的性能将越来越差。如果可以利用用户的负面评价信息找到用户不喜欢的产品黑名单,就可以将其作为用户推荐列表的限制性条件,一旦用户推荐列表中的产品同时也在黑名单,系统就自动将它从用户的推荐列表中去除,从而避免向用户推荐其可能不喜欢的产品,减少用户的不满意度,增强用户对推荐系统的信任。因此利用用户的负面评价信息不但可以降低推荐列表的出错率,还有助于降低系统中的信息冗余,对于推荐系统扩展性问题的解决具有重要意义。

2利用负面评价的个性化推荐算法框架

无论哪一种推荐算法,算法的核心都是相似性搜索,既然通过用户喜欢的产品信息可以找到那些潜在的会得到用户喜欢的产品,那么通过用户不喜欢的产品信息也可以找到那些会让用户不喜欢的产品。基于这种理论假设,我们设计了考虑用户负面评价的推荐算法框架,如图1所示。

该框架的运行原理为:

1)考虑用户评分数据的好坏差异,对评分数据进行分类;

2)通过个性化推荐算法,基于获得用户好评的产品信息得到用户最初的推荐列表,基于得到用户差评的产品信息得到用户不喜欢的产品列表;

3)在过滤模块中,识别并剔除掉那些用户的推荐列表中存在的用户不喜欢的产品列表中的产品,精炼推荐结果。

4)为了验证该框架的运行效果,我们在算法框架的基础上设计了评价指标算法模块,可以从推荐准确度,推荐结果的流行性和多样性,推荐结果的信息量,以及去除的冗余信息量等角度对该算法框架进行评价。

图1考虑负面评价的个性化推荐算法框架

3数值实验

我们采用MovieLens标准数据库中数量级为105的数据集,基于物质扩散推荐算法,对该算法框架进行了数值实验。该数据集包含了943个用户对1682部电影的打分信息。根据打分规则的描述,我们假设用户对电影的打分大于等于3表示用户喜欢这部电影,打分小于3表示用户不喜欢这部电影,据此将数据集分为两部分:基于喜欢的82520条打分信息和基于不喜欢的17480条打分信息。为了考察算法框架的表现,我们把基于喜欢的82520条打分信息按照9:1随机划分为训练集和测试集,进行对照实验。当推荐列表长度L=10时实验结果如表1所示。

1)准确度。平均排序分是衡量推荐算法准确度的一个重要指标,测试集中用户喜欢的所有产品的排序分数的平均值越小,就说明推荐算法趋向于把用户喜欢的产品排在前面,推荐算法的准确度越高。

2)流行性。一个产品的度就是这个产品被收藏的次数,产品的度越大说明越流行。一般而言,推荐列表的产品平均度越小的系统,意味着系统不会总向用户推荐热门产品,用户满意度相对更好。

3)多样性。平均海明距离度量了不同用户推荐列表的差异化程度,最大值为1,即所有用户的推荐列表完全不同,最小值为0,

表1实验结果对比

即所有用户的推荐列表都完全一致。平均海明距离越大说明系统趋向于向不同的用户提供差异化更大的推荐列表,推荐列表的多样性更好。

4)信息量。平均信息量越大,说明每一个推荐结果对用户的效用越大,意味着推荐结果传递的新信息更多,带给用户的意外感更强。

5)冗余度。由于利用负面评价的算法,可以用用户不喜欢的产品列表精炼推荐结果,因此推荐列表总长度更小,推荐列表的信息冗余明显减少。

综上,利用负面评价的算法在以上五个评价指标的表现均优于经典的物质扩散推荐算法。

4总结

在推荐系统的实际应用中,用户的负面评价具有稀缺性,但用户的负面评价信息却能够比大量存在的正面评价信息更准确地反映出用户的兴趣特征,具有重要的研究价值。本文重新考虑了用户的负面评价对改进推荐系统的作用,构建了考虑用户负面评价的个性化推荐算法框架。基于物质扩散推荐算法和MovieLens标准数据集的数值实验证明,利用负面评价的推荐算法框架能在一定程度上减弱庞大数据集数据稀疏性的影响,通过去除冗余信息还能提高系统的推荐质量,可作为目前推荐系统扩展性难题的解决方法之一。

下一步的工作将关注对负面评价信息的影响进行控制。推荐系统的最终目的是向用户推荐他们喜欢的产品,而并非不喜欢的产品,并且负面评价中也存在着不准确的信息,因此如何平衡正面评价和负面评价将是未来的工作重点。

参考文献:

个性化推荐系统篇5

【关键词】多Agent;电子市场;个性化推荐系统;用户行为

随着互联网的普及应用,线上购物优点的突显,其已逐渐成为一种普遍的购物方式,各电商网站为了吸引更多的用户,通常致力于各种推荐策略促销手段的应用,如何根据用户行为,挖掘用户特点实施潜在的、有效的个性化推荐成为了电子市场的热点研究问题。本文引入多Agent技术,利用其自下而上的建模方法,结合动态情境进行用户进行数据分析,通过模型显现分析和预测用户行为特性,构建以商品为推荐对象的个性化推荐系统,为用户推荐符合兴趣爱好的商品。

1 多Agent技术

1.1 Agent技术概念及特征

Agent技术源于人工智能领域,指具有目标驱动能力、自制能力及智能,能够通过各种学习、推理等方法感知和适应复杂的动态环境,并能够主动最亲目标的能动实体[1]。具有一定程度的拟人性,中文可译为智能体,具有一定“拟人”属性,能够代替或协助人完成一定的工作,因而采用Agent技术构建个性化电子市场推荐系统具有一定的可行性和先进性。

Agent具有如下特征[2]:

智能性:具有推理能力,能有针对性地分析解决问题,提供准确信息,进行复杂任务的分解、分析、预测用户意图。

社会性:通过通信语言与Multi-Agent进行交互,协调任务、消解矛盾,通过与其他 Agent 协同工作执行和完成独自无法解决的复杂工作。

反应性:自主感知外部环境,并作出及时的反应。

自适应性:根据计算环境,针对不同系统终端,自动采取行为,进行自主学习,自动识记用户信息,进行自主决策,将用户兴趣、爱好、习惯等情境信息进行主动存储,建立用户日志,提供主动服务。

能动性:无需外界操作控制自主运行控制自身行为及内部状态。

1.2 多Agent系统

Agent的社会性特征,采用多Agent进行系统架构,通过对单个Agent系统的优化组合,多Agent系统能够实现系统目标、资源的合理统筹,能够最大限度的实现不同的目标[3]。同时,由于单个Agent系统具有一定的独特性,自治性,将多个Agent进行协同工作时,能够构成多个节点,在独立工作的同时又形成求解网络,较大程度的提高了系统的工作效率,因此,多Agent信息推荐系统对于个性化信息推荐具有极大的优势。

2 基于用户行为的multi-Agent电子市场个性化推荐系统的整体架构

本文提出了基于用户行为的multi-Agent电子市场个性化推荐系统(multi-Agent E-Commerce personalized recommendation system based on user behavior,MACPRSUB)。电子市场交易活动,受当前情境影响,如消费者用户个性特征(年龄,收入,偏好等)、网络状态、购买经历、市场服务等内外部情境。MACPRSUB的主要功能为,通过分析用户行为,购买经历,建立用户日志,分析用户兴趣,行为偏好,建立用户模型,进而进行商品服务推荐,刺激和帮助用户做出购买决策实施购买行为。由于用户在购买决策的过程中会处于动态情境中,发生不断的变化,因此本文基于Agent的特征构建了如下图所示的多Agent共同协作的动态MACPRSUB推荐系统,结构如图1所示。

每位进入电子市场的线上购物用户都会获得一个用户Agent,监听用户行为,反馈给相关联的终端Agent,由终端Agent建立用户日志,进行基于行为的用户偏好建模,进行用户细分。辅助Agent在推荐系统中与用户及电子市场MACPRSUB推荐系统数据库相互关联,互相提供信息,用户通过辅助Agent获得市场信息进行搜索等操作,电子市场通过辅助Agent获得用户信息,决定和改善推荐策略。

图1 MACPRSUB推荐系统整体架构

下面对MACPRSUB推荐系统中的各Agent的功能进行具体的描述。

2.1 用户Agent

用户Agent主要有两个任务,一个是通过终端Agent获取商品信息,终端Agent提供搜索功能;例外一个是向终端Agent传递用户信息,便于终端Agent分析和建立用户日志,进行偏好建模,进而决定和改善推荐策略。

用户Agent由连接参数(Connection Parameters,CPS)和用户配置文件组成(User Configuration File,UFC)组成。链接参数里面主要由用户终端Agent数量构成,每个用户根据其访问记录配置N不同的终端;用户电子市场会话行为数据记录在用户配置文件中,主要根据用户访问的不同终端及节点,以及访问的商品内容,记录和分析用户的情景偏好兴趣度(SIW)。

2.2 终端Agent

终端Agent用于链接用户Agent和辅助Agent,进而与MACPRSUB推荐系统建立关联。终端Agent通过辅助Agent向用户Agent传递电子市场的商品信息,通过与用户Agent的关联建立用户日志,分析用户偏好,建立用户模型,进而进行用户细分,同时可以对用户进行智能跟踪计算,通过辅助Agent,向推荐系统提出改善和决策建议。

终端Agent由用户配置文件和终端配置文件组成。当用户在某一终端进行电子市场会话时,对商品C进行相关操作时,其历史用户文件会自动进行匹配及更新操作,由此建立和更新用户配置文件。用户在进行的与商品C相关的电子市场行为耗时t越长,表明其对商品C的兴趣度IW越高。

2.3 电子市场数据库和辅助Agent

电子市场数据库包含所有在线商品及商铺列表,与辅助Agent共同生成商品(商铺)列表,辅助Agent主要包含商品商铺列表、全局配置文件集,配置文件接收映射器。当用户u在终端t进行电子市场商务会话时,与之相关联的终端(tagent)会将终端配置文件传输给市场Agent,根据用户细分,将分配一个辅助Agent与之相关联。在基于内容的推荐过程中,辅助Agent与电子市场数据库相结合创建一个符合当前用户u的商品商铺列表CSL,并记录在用户配置文件UFC中,同时传送给辅助Agent,进而根据用户偏好系数IW将商品商铺列表进行降序排列。在协同过滤推荐过程中,为了与使用相同终端t的用户相比较,辅助Agent会将用户u的商品列表与用户m的商品列表相比较生成新的商品列表CSLi,并将其归属于与用户u具有最小差异性的n个用户的访问列表。

3 实验与结果

本系统检测以Repast[4]的多Agent系统为仿真平台,采用JAVA编程语言,在实验过程中设置生成100个用户,并邀请了不同结构层次的用户参与了该推荐系统的电子市场对话行为,进行了数据记录,建立用户元组(Ca,Cb,t,r),用户电子市场会话轨迹从商品Ca到商品Cb,在各个页面的停留时间t,及对商品的评分r,并创建用户的初始配置文件UCF。每个用户根据分配的元组生成一个商品推荐列表L(n),并验证Ca是否在列表中,结果保存为值?资唬

?资=0,b?埸L(n)1,b∈L(n)

表2 推荐系统前后购买率

上表展示了不同结构层次下三种情况下S1、S2、S3的实验结果,从表中可以清楚的了解到MACPRSUB具有较为优秀的推荐性能,能够最大程度的促成用户的电子市场购买行为。

多Agent电子市场MACPRSUB推荐系统,根据用户的不同情境,如使用的不同终端设备接入电子市场,系统会根据用户历史配置文件进行自适应推荐,并同时进行更新,并根据用户的历史日志自计算预测用户的当前及外来会话走向,发送推荐预约。但是本系统还可以进行更为深入的优化,如根据情境定义用户聚类问题,稀疏数据的准确推荐问题,用户配置文件的自更新计算问题。

【参考文献】

[1]危世民,戴牡红.多Agent协同的电子商务推荐系统模型[J].计算机应用,2014,34(4):1118-1121.

[2]闫燕,王锁柱.基于多Agent的电子商务个性化推荐系统模型研究[J].情报杂志,2007,5:59-61.

个性化推荐系统篇6

论文关键词:学习风格,Web挖掘,个性化推荐,AprioriAll算法

 

一、引言

基于Internet技术的教育网络化趋势不仅为学生提供了便利的学习方式和广泛的选择,也为学校提供了更加深入地了解学生需求信息和学生行为特征的可能性。但随着Web上信息量的爆炸式增长,网上的资源得到极大丰富的同时也充斥着大量的垃圾信息,当学生们面对这些庞大芜杂的信息海洋时变得无所适从,因而迫切需要能从这些纷繁芜杂的信息海洋中主动过滤并推荐给学生他们所需信息的个性化辅助教学推荐工具,本文就是针对这个问题而提出的。

目前人们利用数据挖掘技术,提出了许多个性化推荐系统。本文提出通过心理学量表对学习风格进行测试,并针对实际收集到数据的稀疏特点,采用项目评分预测的协同过滤算法[1](Item-Based Top-N推荐算法),尽可能准确地测试出学生的学习风格。然后结合Web日志挖掘技术,收集不同风格学生浏览网页的特点,通过AprioriAll算法求解频繁访问序列[2],得到不同风格学生的Web使用习惯,然后依据当前学生浏览页面向学生实时推荐下一步可能会访问的部分网页Web挖掘,提高学习效率。

二、个性化教学系统结构设计

根据WWW体系结构和网络学习系统的特点,需要采用一种新的设计框架来处理挖掘过程。作者采用挖掘学生历史浏览行为(记录在服务器日志中)和分析学生学习风格这两类特征来构建学生模型。

首次登陆系统时需对学生的学习风格进行测试,首先利用项目评分预测协同过滤算法(Item-Based Top-N)对未评分的项目进行评分,然后统计总分即可得到学生的学习风格类型这一特征值;对于己注册的学生则提取MFR路径(最大前引用)对Web服务器中的Web日志进行预处理,可得到学生最大向前向访问的路径,再用AprioriAll算法挖掘学生访问网页的频繁序列,把这一频繁序列作为特征值连同学生风格这一特征值进行数据预处理,即可得到学生个体兴趣模型,然后对其进行访问模式挖掘即可得到学习风格类型相同的学生所具有的访问模式,最后根据这一访问模式利用个性化推荐算法进行学习内容推荐。本文的系统结构设计如图1 所示。

图1个性化挖掘和推荐模块

三、 实现个性化教学推荐系统的关键步骤

1 构建学习风格及兴趣模型

学习风格是学生对学习方法的定向或偏爱,是学习者特有的认知、情感和生理行为,是学生持续一贯带有个性特征的学习方式。因此本文结合学习风格构建能代表学生特征的学生学习风格及兴趣模型。为了更加准确的测试出学生的学习风格类型,本文采用了所罗门风格量表和Kolb风格量表进行测试,由于学生数目的急剧增加和项目众多的风格量表导致学生评分数据的不完善,而产生了数据的稀疏性,这使得计算目标用户的项目评分后不能准确的测试出学生的学习风格。本文来采用基于项目评分预测的协同过滤推荐算法[1]计算项目间的相似性,预测学生对未评分项目的评分,就可以有效地解决数据稀疏情况下的学习风格的测试问题,能更加准确的测试出学生的学的风格中国学术期刊网。具体实现如图2所示。

图2学习风格的测试流程

首先可以得到学生学习风格测评数据矩阵,假设用户为User-1,User-2,…,User-n,心理学量表的测量相目为Item-1,Item-2,…,Item-m,这样矩阵的形式如图3所示。

显然当缺少学生对某一些项目的评分时,量表就无法完成对学习风格的评价,在自主学习的环境产生这种现象中是很常见的。为此有必要填补学生未评分的部分,完成对学习风格的评价。作者通过两步来完成对未评分项目的填充:

 

用户项目

Item-1

Item-2

Item-j

Item-m

User-1

R11

R12

R1j

/

User-2

R21

/

R2j

R2m

/

 

 

User-i

Ri1

Ri2

/

/

User-n

/

Rn2

Rnj

个性化推荐系统篇7

在线学习资源建设已经成为了当今数字化学习研究的热点问题。本文以学习过程中学习者学习行为和在线学习资源的特点为基础,结合协同过滤算法,设计了基于协同过滤技术的在线学习资源个性化推荐系统模型。实践证明,该模型可以更好地为学习者创造数字化学习环境,提高学习者的自主学习效率。

【关键词】 协同过滤;个性化推荐;学习行为;自主学习

【中图分类号】 G40-057 【文献标识码】 A 【文章编号】 1009―458x(2012)08―0078―05

一、引言

E-learning作为一种基于计算机通信技术的学习方式,可以最大限度地利用网络教学资源,学习者在学习过程中不必受到时空环境的限制,随时随地根据自身需要进行自主学习。这种新型的学习形式目前已经广泛的应用于各种在线课堂教学和技能培训领域。虽然E-learning教学资源建设已经取得了阶段性成果,但是主要有以下几个问题:(1)资源数量爆炸性增长。如今在线学习资源数量繁多,资源的质量和水平参差不齐,学习者往往无法辨别资源的优劣,导致学习资源的利用水平并不理想。(2)资源种类多样化。在线学习资源除了传统的文本类型以外,还有声音、图像、视频等多种媒体类型,媒体类型的不一致也给资源的搜索和归类带来了不便。(3)资源非线性呈现。与传统教学中的书本不同,在线学习资源一般以超文本链接联系各个知识点,学习者以非线性的方式进行学习,知识点的“跳跃性”也容易让学习者在学习时产生迷茫感。以上问题使得目前很多的E-learning系统无法根据不同学习群体的不同学习特征来提供个性化的学习支持服务。随着人们对在线学习资源认识的不断深入,具有智能分析技术的在线学习资源系统将是未来资源建设发展的趋势之一。由于学习者群体的特殊性,每位学习者都有其潜在的学习兴趣,协同过滤技术可以帮助学习者快速地发现有价值的资源,自主选择学习内容,根据自身的兴趣度来完善知识体系。因此,本文将协同过滤技术手段和在线学习资源的特征相结合,从学习者自主学习的角度来构建满足学习者个性化需要的在线学习资源系统。

二、文献综述

个性化推荐是对用户的兴趣、爱好、行为进行分析和建模,根据分析得出的结果给用户提供“个性化”、“定制化”的服务,以解决目前互联网中信息过载这一问题。目前,个性化推荐技术可以分为内容过滤推荐、规则过滤推荐和协同过滤推荐。

1. 内容过滤推荐技术

基于内容的推荐是较早提出的一种推荐技术,该算法的原理是利用概率或者机器学习技术将用户的已有兴趣表示为模型,然后与资源进行比较,通过两者之间的相似程度来为用户进行推荐。

2. 规则过滤推荐技术

基于规则的推荐是将推荐规则事先进行保存,然后通过这些规则对用户进行推荐。规则过滤推荐系统中规则的质量和数量决定了推荐的效果,从本质上说规则就是“if-else”类型的语句,这些语句分别描述了不同情境下以何种方式进行推荐。

3. 协同过滤推荐技术

协同过滤技术最早于1992年出现在Tapestry系统中,当时主要用于解决电子邮件系统的筛选问题。随着协同过滤技术的发展,协同过滤技术在商业领域取得了较大成功。国外最具代表性的协同过滤系统有Amazon和Facebook的广告系统,Amazon是根据用户购买和查看图书的记录来为其推荐可能感兴趣的书籍,Facebook则是依托其庞大的用户群,根据朋友间的兴趣来进行广告营销。与国外相比,国内的协同过滤系统研究起步较晚,目前国内比较成熟的协同过滤系统主要有当当网和豆瓣猜。当当网和Amazon的功能类似,同样是用于图书商品的推荐,豆瓣猜是通过分析用户读书记录来预测用户可能喜爱的书籍。协同过滤技术为网站增加了收入来源,增强了用户体验度,受到了用户的好评。

以上三种个性化推荐技术的优缺点如表1所示。

协同过滤技术从算法上分类可以分为基于用户的(User-based)协同过滤算法和基于项目的(Item-based)协同过滤算法。基于用户的协同过滤算法认为相似用户评价的项目之间存在相似性,可以以此来预测某个用户对该项目可能的评价;基于项目的协同过滤算法则采用计算项目之间相似度的方法来预测用户对其他项目的评价。

围绕协同过滤技术算法,国内外研究人员从个性化推荐的角度进行了一系列的研究工作。关于User-based算法,2009年Xia提出了一个改进的User-based协同过滤算法[1],在算法中引入用户加权值,来提高算法的准确度;2010年,Robert和 Istvan将分布式技术与User-based协同过滤算法相结合,提出了一个完全的分布式推荐系统[2];Zhao 和Shang 提出了一个云平台的用户协同过滤算法,提高了协同过滤算法的可扩展性能[3];Mu和Chen在User-based协同过滤算法基础上引入了犹豫度概念(Hesitation Degree)来提高协同过滤算法的准确性[4]。关于Item-based算法,2009年,Luo和Tian采用slope-one方案来应对协同过滤中的评级矩阵稀疏性问题[5];2011年,Lei 和Junzhong 将用户从众的心理和一般用户评价心理区分开来,采用均衡的基于项目的预测方法来对项目进行评价预测[6];Gao和Wu以Userrank排名的数据模型为基础计算项目之间的差异性,提高算法的推荐质量[7]。以上研究工作的重点是从协同过滤的算法效率和扩展性的角度来提高个性化推荐的精度,而对于学习者进行在线学习时产生的学习行为特殊性并没有给予太多的关注。鉴于以上问题,本文的研究重点是设计出一个基于协同过滤技术的在线学习资源模型,该模型能够利用协同过滤技术的突出优点,分析学习者的学习行为特征,为学习者推荐出可能感兴趣的学习资源,提高在线资源的利用率,促进学习者完成知识的加工和建构。

三、基于协同过滤技术的在线学习

资源个性化推荐系统模型

通过对国内外研究成果进行分析,本文将学习者在线学习过程中的学习行为与在线学习资源特点作为设计基于协同过滤技术的数字化学习资源模型的依据,在强调学习者自主学习的基础上结合协同过滤技术算法,形成一套基于协同过滤技术的在线学习资源个性化推荐系统模型,如图1所示。该模型中最重要的部分有3个:学习者行为日志和学习资源库、数字化模型以及协同过滤引擎。

1. 学习者行为日志

由于学习者在线学习的过程中不仅仅是对学习资源库中资源的简单提取,同时会产生收藏、下载、浏览和评价等学习行为。这些学习行为显性或隐性地表现了其学习兴趣,所以在该模型中,我们将学习者的学习行为收集并记录下来,挖掘学习者的学习行为轨迹,建立学习者的行为模型。

2. 学习资源库

学习资源是个性化推荐系统的基础。作为学习者学习资料的来源,学习资源库提供了文本、音频和视频等资源供学习者学习。由于资源库中资源数量庞大,推荐系统对于每个资源都加入了社会化标签,标签的引入有助于对资源内容进行分类,实现资源的统一管理和高度共享。

3. 协同过滤引擎

协同过滤引擎是个性化推荐系统的核心。该引擎将学习资源库中带有社会化标签的“孤立”资源关联起来,并且将学习者行为模型数字化为学习权重值,选择合适的推荐策略,产生候选推荐资源集,以多种媒体呈现的方式为学习者推荐其可能感兴趣的学习资源。协同过滤引擎能够有效地解决目前学习资源建设水平低,不利于学习者搜索等问题,保证了个性化推荐的质量。

四、 基于协同过滤技术的在线

学习资源个性化推荐算法

协同过滤算法基于以下假设:(1)用户之间的兴趣是具有相似性的。(2)由于用户对资源的操作评价包含了他们的兴趣偏好,所以我们以此来作为对其他用户预测项目的依据来源。传统的协同过滤算法主要分为三个步骤:获取用户-项目信息、计算查找相似用户集、产生推荐结果。协同过滤技术主要依赖于用户对项目的操作和评价,可以筛选出从内容和类型上难以区分的项目,用户之间可以共享资源和经验,而且其自动化和个性化的程度相比传统推荐方式要高出很多。但是从以上步骤我们可以看出,传统的协同过滤算法推荐结果依赖于用户对项目的评分,当用户对项目的评分过少时,推荐结果就会出现误差,这也就是我们常说的矩阵稀疏性问题。

本文将协同过滤算法引入到数字化学习领域,针对矩阵的稀疏性问题提出了一种改进的协同过滤算法。解决矩阵稀疏性问题的传统方法主要是通过给矩阵添加默认值,这种方法虽然能从一定程度上缓解矩阵的稀疏性问题,但是不能有效地对用户的兴趣倾向给出正确的分析。基于以上问题,本文给出的推荐算法的思路是在矩阵初始化时,如果用户对项目的评价较少,则挖掘用户对资源的其他行为(如:浏览、收藏、下载等),将用户的行为操作作为权重值加入到用户相似性计算中,该算法与传统的协同过滤算法相比,能够有效地解决矩阵的稀疏性问题,推荐精度也有了大幅提高。

基于协同过滤技术的在线学习资源个性化推荐算法流程如图2所示,在推荐过程中当学习者-资源矩阵过于稀疏时,该算法会对用户行为进行挖掘,填补矩阵稀疏的缺陷,以此提高推荐的精度。

1. 获取学习者―教学资源矩阵信息

首先将M个学习者对N个教学资源的评价转化为分值(主要是学习者对学习资源的显式评分),然后形成如表1所示的MN矩阵。其中第i行j列的Ei,j代表了第i个学习者对第j个教学资源的评分。

2. 计算学习者―学习资源矩阵稀疏性

首先我们给矩阵稀疏性设定一个最小限定值Φ,然后计算矩阵的实际稀疏情况。

稀疏计算公式为:

Sparsity=■,其中EvalNum为学习者对资源的评价数量,LearnerNum为学习者的数量,ResNum为学习资源数量。当Sparsity < Φ时,说明教学资源库评价矩阵过于稀疏,对用户行为进行挖掘。挖掘完成后对照表4计算和规格化用户行为的权重值,添加到评价矩阵中。

3. 计算查找相似用户集

在协同过滤算法中,计算查找相似的邻居集是最为关键的一步,首先从表3取出中m个学习者对n个教学资源的评分,然后通过相似度计算方法计算出学习者之间的相似度。其中相似度计算方法主要有两种:余弦相似性算法和修正的余弦相似性算法。

(1)余弦相似性算法是最为典型的相似性计算方法,过程是将用户对项目的评分看做是n维的向量,然后通过计算其余弦的夹角来得出用户之间的相似度,其具体算法如公式(1)所示。

Sim(i,j)=■ (1)

(2)修正的余弦相似性算法将余弦相似性算法做出了修改,为了减少用户主观性引入用户对项目平均评分的概念。在计算时将项目的评分减去该用户对所有项目的平均评分。其具体算法如公式(2)所示。

Sim(i,j)=■(2)

本文将步骤2中的用户行为权重值加入到相似性算法中,形成了一种改进的相似性计算方法,为加入权重值的学习者-资源评价数值,改进的相似性算法如公式(3)所示。

Sim(i,j)=■ (3)

相似度计算完成后将会得到与用户相似度最为接近n个用户的邻居集Z={User_1,User_2,User_3,…User_n;}

4. 产生推荐结果

一般根据上步得出的邻居集中用户对项目Itemn,s的评分,就可以预测出目标用户对该项目的评价,并且产生最终的推荐结果。因为学习者学习和评价的风格有所不同,所以本文采用如下推荐方式。

Pj,k=■j+■sim(j,x)(R■-■x)/■sim(j,x) (4)

在公式(4)中Pj,k为推荐系统预测的学习者j对资源k的评分,■j为学习者j所有已经评分分值的平均值,Z为上一步得出的最近邻居集,最后取出相似度最高的N个资源,得出推荐结果,推送给学习者。

五、基于协同过滤技术的在线学习

资源个性化推荐系统应用

本文在上述研究成果的基础上,结合在线学习资源和协同过滤技术的特点,设计开发了基于协同过滤技术的在线学习资源个性化推荐系统(如图3所示),并作为推荐模块应用于网络培训教学中。与传统的在线培训系统相比,在线学习资源个性化推荐系统能有效收集网络教学中学习者的反馈信息,为其他学习者提供需求相似的资源列表,与学习者进行交互,节省在线学习者获取信息和知识的成本。接下来,我们以该推荐系统中实际的用户数据为例,阐述系统是如何为用户推荐个性化资源的。

首先,个性化推荐系统中的行为收集模块从用户日志文件中收集用户行为,建立用户行为模型(如表4所示),并将其数据化。

然后,推荐系统中的用户显示评价模块收集用户主观评价数据(分值代表用户对资源的喜好程度,分值越大代表用户对该资源的兴趣度越高,如表5所示)。

最后,以用户的行为数据和评价数据为依据,计算资源相似度,产生用户最近邻居集,预测出用户n在使用资源n时可能感兴趣的资源列表(如表6所示)。该资源列表由推荐系统自动分析生成,以此来提高学习者的学习效率。

六、结论与展望

本文首先分析了传统协同过滤技术普遍存在的问题,进而提出了一种改进的协同过滤算法,该算法引入了用户行为权重值概念,缓解了协同过滤算法普遍存在的冷启动问题。其次将协同过滤技术与在线学习资源相结合,设计了在线学习资源个性化推荐系统,实现了学习者自主学习,自主评价,资源共享等功能,提升学习者的学习效果。虽然在线学习资源内容不会发生变化,但是随着用户学习的不断深入,学习兴趣和方向可能不断变化,如何根据用户兴趣的变化进行实时地推荐,需要进行深入的研究。

?眼参考文献?演

[1] Xia Jianxun.An Improved Similarity Algorithm Based on Hesitation Degree for User-Based Collaborative Filtering[A]. Conference on Communication Faculty [C]. Nanning, PEOPLES R CHINA: Proceedings of 2009 Conference On Communication Faculty,2009,104-108.

[2] Ormandi,Robert;Hegedus,Istvan.Overlay Management for Fully Distributed User-Based Collaborative Filtering[A]. 16th International Euro-Par Conference on Parallel Processing[C]. Ischia, ITALY:EURO-PAR 2010 PARALLEL PROCESSING PT I,2010,446-457.

[3] Zhao Zhi-Dan;Shang Ming-Sheng .User-based Collaborative-Filtering Recommendation Algorithms on Hadoop[A]. 3rd International Conference on Knowledge Discovery and Data Mining[C]. Phuket, THAILAND: Third International Conference On Knowledge Discovery And Data Mining Proceedings,2010,478-481.

[4] Mu,XW; Chen, Y. An Improved Similarity Algorithm Based on Hesitation Degree for User-Based Collaborative Filtering[A]. 5th International Symposium on Intelligence Computation and Applications[C]. Wuhan, PEOPLES R CHINA: Advances In Computation And Intelligence,2010,261-271.

[5] Luo,Q;Tian,X.A Personalized Recommendation Algorithm Combining Slope One Scheme and User Based Collaborative Filtering[A] International Conference on Industrial and Information Systems[C]Hankou,China: 2009 International Conference On Industrial And Information System,Proceeding,2009,152-154.

[6] Lei Ren; Junzhong Gu.An Item-based Collaborative Filtering Approach based on Balanced Rating Prediction[A] 2011 International Conference on Multimedia Technology[C].Hangzhou,China: 2011 International Conference on Multimedia Technology,2011.

[7] Gao,M; Wu, ZF.Userrank for item-based collaborative filtering recommendation[J]. Information Processing Letters,2011,(9):440-446.

收稿日期: 2012-04-15

作者简介:孙歆,硕士生,浙江工业大学教科学院(310014)。

王永固,副教授,博士,浙江工业大学教科学院副院

长(310014)。

个性化推荐系统篇8

论文关键词:个性化推荐,购买决策,认知,理性行为理论

 

0引言

随着3G技术以及MEC(Mobile Electronic Commerce,移动电子商务)的发展,商品和消费者需求的多样性成为趋势。如何便捷、有效、低成本地帮助消费者找到最满足其个性化需求的商品,成为亟待解决的问题。个性化推荐系统恰恰能帮助MEC商家实现这一目标。

但有关个性化推荐的研究大多只关注推荐系统本身,很少关注其对购买决策的影响。有鉴于此,本文主要探讨MEC环境下推荐系统如何影响购买决策,它的哪些性质会影响其作用力。进一步地本科毕业论文格式,基于现状的构建个性化推荐系统的一些建议将会被提出。

1消费者购买决策

广义的消费者购买决策是指消费者为了满足某种需求,在一定购买动机的支配下,在可供选择的两个或两个以上的购买方案中,经过分析、评价、选择并且实施最佳的购买方案,以及购后评价的活动过程。[1]

消费者行为学中认知的观点认为,消费者是思维问题的解决者,会主动搜索满足其需求的产品和服务。消费者还是信息的处理者,通过对信息的处理加工形成偏好并最终形成购买意向。认知观点意识到消费者不会试图获取全部相关信息,当他们认为已得到足够支持其决策的信息时,就会停止搜索努力。

消费者的购买决策过程基本上包括需求的认知、信息搜索和评价、购买决策和行动、购买后评价四个过程论文开题报告范例。[2]如图1所示。

2个性化推荐系统对购买决策的影响

网络购物环境使消费者对商家和商品的选择增多,也使得他们更加借助信息搜索和决策辅助工具(如个性化推荐系统)。推荐系统根据用户的兴趣特点和购买行为,向用户推荐用户感兴趣的信息和商品,它能将浏览者转变为购买者,提高交叉销售能力本科毕业论文格式,并提高客户的忠诚度。推荐系统的主要目标在于代替消费者完成繁杂的信息处理任务,使消费者将更多的精力投入到决策中来。可以从决策过程和决策结果两个方面,探讨推荐系统对MEC消费者购买决策的影响。[3]

2.1对决策过程的影响

消费者对于商品的知识的认知是有限的,在其作决策之前常常不能深层次地了解商品。两阶段决策处理可以使决策复杂性降低。消费者先搜寻众多商品以得到商品的详尽信息,并选出最有希望购买的一部分商品。接着针对商品的重要属性进行更深入地比较,最后做出决策。

个性化推荐系统可以通过减少消费者两阶段决策中的决策努力,影响其决策过程。而消费者的决策努力通常用决策时间和产品搜索范围来衡量。推荐系统可以依据消费者的喜好参数迅速提取出最匹配的商品,从而减少总体决策时间。推荐系统还能按消费者偏好程度将商品信息依次排列,从而缩小产品搜索范围。[4]

此外,推荐系统还会影响消费者的功能偏好、商品估价、筛选策略。由于信息不对称,消费者往往事先没有形成稳定的偏好,而是在购买决策发生的同时产生,因此往往受推荐系统所推荐信息的影响。例如,消费者往往会更关注那些旁边标有更高得分或等级的产品。

2.2对决策结果的影响

应用推荐系统能增强消费者的认知能力本科毕业论文格式,使其更倾向主导产品,进而减少产品转换的概率,从而提高决策质量。推荐系统的使用还能减少信息搜索的努力,减少考虑集的信息量,提高其质量,从而提高决策质量。

推荐系统有助于降低消费者产品转换的概率,有助于增加其购买决策的选项,从而增强决策信心。[5]

购买决策目标实现得越多,消费者也越满意。因此可以认为,推荐系统因其对决策目标实现的帮助,影响购买决策的满意度。

根据理性行为理论,消费者的理念和评价影响其态度,进而影响其意愿论文开题报告范例。推荐系统会影响消费者的功能偏好和商品评价,进而影响对某商品的态度本科毕业论文格式,从而影响对该商品的购买意愿,最终影响购买选择。

综上所述,推荐系统对决策结果的影响主要体现在四个方面:提高决策质量;增强决策自信;增强决策的满意度;影响最终购买选择。

3影响推荐系统效用的因素

推荐系统的效用即推荐系统对消费者购买决策过程和决策结果的影响力。推荐系统的因素、消费者的因素以及消费者与推荐系统之间的交互,都会影响推荐系统的效用。

3.1推荐系统的角度

①推荐系统类型的影响

一般来说,推荐技术可从信息过滤角度分成三种,分别是基于内容的推荐、协同过滤推荐以及混合推荐即内容和协同过滤的组合推荐。在购买决策中,混合式推荐更能提升用户的决策自信。

②推荐系统输入的影响

推荐系统需要接收消费者的数据输入并作为推荐的主要数据依据,具体可以分为隐式浏览输入、显式浏览输入、关键词和项目属性输入、客户购买历史四类。消费者更愿意接受显式浏览输入、关键词和项目属性输入等可控方式所推荐的信息。

③推荐系统输出的影响

推荐系统输出的主要形式有建议、预测、评分、评论。输出内容的详细程度、透明度、个性化等,输出形式方面推荐的数量和产品信息的编排都会影响消费者对推荐系统及其推荐信息的信任,并因此影响购买决策。

④推荐系统推理过程的影响

进度显示模块使信息搜索的过程更加直观,反馈时间会影响消费者对推荐系统的使用意向,缩短消费者可感知的等待时间,改善消费者的情绪,促进推荐系统的效用。

⑤其他相关因素的影响

信息来源的可靠性即推荐系统所在网站的可靠性直接影响消费者对推荐系统的评价高低。

3.2消费者的角度

消费者对于所选产品的知识越丰富本科毕业论文格式,则在购买决策过程中进行越少的信息搜索,对推荐系统等决策辅助工具的感知有用性就越小,决策自信也就越小。与此相反,当消费者具备较少的产品知识和经验时,更难相信自己能做出正确的选择,更有可能去寻找他人的建议。

消费者对风险的感知也会影响推荐系统对决策质量和决策努力的影响,即当用户感知风险越大,推荐系统对提高决策质量和减少决策努力的影响力会更明显。

消费者特性对系统效用的影响如图2所示。

3.3消费者与推荐系统交互的角度

消费者与推荐系统之间的交互对推荐系统作用效果具备作用力,主要从消费者与推荐系统的相似性、消费者对推荐系统的熟悉度两方面来考虑。

消费者与推荐系统的关系强度(包括熟悉程度、亲密程度、支持度和结交)决定了推荐的效果。用户与推荐系统在各产品属性权重的相似性将带来更好的决策质量,同时减少信息搜索量。

4. 个性化推荐系统应用的不足

对比上述影响因素,我们不难发现当前移动电子商务环境下个性化推荐系统应用中的一些不足。这些不足主要包括:①战略上不够重视,体系结构不完善,大部分的个性化推荐系统都只是一个单一的工具,只能提供一种推荐模型;②功能还不够完善本科毕业论文格式,个性化程度不够高;③易用性不高,信息杂乱无章;④对推荐结果缺乏解释,缺少有效的方法向用户解释产生推荐的原因;⑤网站本身形象不好,影响消费者认知;⑥消费者获取推荐信息的途径单一,推荐结果的形式不够灵活。

5对个性化推荐系统应用的建议

5.1提高对推荐系统的战略认知

推荐系统在MEC领域的应用既能影响消费者的购买决策,又有助于商家实时追踪消费者购买行为和兴趣偏好,挖掘其潜在需求,并以此不断创新产品和营销模式论文开题报告范例。[6]我们建议MEC商家提高对推荐系统的战略认知,重视它的战略意义。

5.2完善个性化推荐功能

个性化是影响认知价值最主要的因素,我们建议MEC商家实时追踪消费者需求的变化,并尽最大努力推荐符合消费者需求的产品,使推荐的产品在功能、外观、价格、售后等方面最大程度地满足消费者的偏好与标准。

5.3加强信息排列的合理性

推荐系统提供信息的排列会影响其作用效果。若消费者能更方便地获取相关信息,则会更加信任推荐系统,也更易受推荐系统影响。我们建议MEC商家对各类推荐信息做合理的编排本科毕业论文格式,便于消费者获取。

5.4增进消费者的熟悉程度

消费者对推荐系统的熟悉程度(包括推荐形式、信息排列、推荐原理等)能影响消费者对推荐系统的信任,并因此间接影响推荐系统的作用效果。我们建议MEC商家增进与消费者的互动,提供个性化推荐服务的有奖体验等,以提升消费者对推荐系统的信任和推荐系统的影响力。

5.5擢升网站自身形象

网站的形象显著影响消费者对推荐系统的认知价值和信任,并间接影响决策影响力。我们建议MEC商家提高自身网站的知名度、声誉度,改善网站的美观性、易用性。

5.6拓展产品推荐的渠道

获取推荐信息的渠道也会影响推荐系统的作用效果。我们建议MEC商家拓宽产品推荐的渠道,如提供邮件定制、短信定制、首页定制、推荐定制等多渠道服务,以方便消费者获取相关信息。

参考文献

[1]王长征.消费行为学[M],武汉:武汉大学出版社,2003,26-27.

[2]李双双,陈毅文,李江予.消费者网上购物决策模型分析.心理科学进展[J],2006,14(2):294-29.

[3]Haubl, G. & Trifts,V. Consumer Decision Making in Online Shopping Environments: The Effects of InteractiveDecision Aids[J]. Marketing Science, 2000,l(19):4-21.

[4]Xiao B. & BenbasatI. E-commerce Product Recommendation Agents: Use, Characteristics, and Impact[J].MIS Quarterly, 2007, 31(1):137.

[5]Vijayasarathy,L. R. & Jones, J. M. Do Internet Shopping Aids Make a Difference? An EmpiricalInvestigation[J]. Electronic Markets, 2001, 1 (11): 75.

[6]张娜.电子商务环境下的个性化信息推荐服务及应用研究[D]. 硕士学位论文,西北工业大学,2006.

个性化推荐系统篇9

[关键词] 电子商务 推荐系统 推荐技术

随着互联网的广泛普及,电子商务获得迅猛发展。与传统商业模式不同,电子商务交易双方是不谋面的,商家不能直观地了解客户,能获得的只是大量的相关数据(如用户注册信息、历史购买记录等)。这样通过对数据的分析来尽可能地揣摩客户,在适当的时间向适当的客户推荐适当的商品或服务就显得尤为重要,电子商务推荐系统正是针对这一需求应运而生的。

一、电子商务推荐系统简介

电子商务推荐系统是一个基于网上购物环境、以商品为推荐对象的个性化推荐系统,为用户推荐符合兴趣爱好的商品。其定义为:利用电子商务网站向客户提供商品信息和建议,帮助用户决定应该购买什么产品,模拟销售人员帮助客户完成购买过程。

电子商务推荐系统使得电子商务网站主动适应每个客户的特定需求,为每个客户创建适应该客户个性化需求的电子商店,从而为每个客户提供完全不同的个性化购物环境,为电子商务系统实现“一对一营销”的个性化服务提供了可能。

电子商务推荐系统和销售系统、决策支持系统既相似又有不同。销售系统是帮助销售人员如何把产品销售出去;决策支持系统是帮助生产者决定什么时候生产什么产品,其目的是为企业生产者服务;推荐系统是帮助用户对购买什么产品做出决策,是面向用户的系统。

二、电子商务推荐系统的作用

电子商务推荐系统的最大优势在于它能够根据客户的兴趣、爱好、习惯,以及各个客户之间的相关性主动为客户做出推荐。WWw.133229.coM推荐的形式包括向客户推荐商品,提供个性化的商品信息、及其他客户的喜恶等,并且给出的推荐也是实时更新的。即当系统中的产品库和客户的兴趣等资料发生改变时,给出的推荐信息也会自动改变。广义而言,推荐系统使得网站更具个性化(网站会调整某些信息以迎合不同的客户)。总的来说,电子商务推荐系统的作用主要表现在三个方面:①将电子商务网站的浏览者转变为购买者。有时客户只是看看网站的内容而没有购买的意思,推荐系统可以帮客户找到他们感兴趣的、愿意买的商品。②提高电子商务网站的交叉销售能力。基于用户已经购买的商品,推荐客户购买一些相关的商品。③提高客户对电子商务网站的忠诚度。推荐系统可以提供符合客户个性化需求的购物信息,因此能够吸引老客户访问网站。

三、电子商务推荐技术

目前,电子商务推荐系统所采用的推荐技术大致可以分为三类:信息检索、内容过滤、协同过滤。

1.信息检索:响应用户提交的搜索请求,返回相应的查询结果。网络搜索引擎如yahoo,google等采用的都是这种技术。信息检索技术一般对文本内容建立全文索引或摘要索引,对非文本内容如图片、视频等根据一些特征进行索引。信息检索技术容易实现,检索速度快,但其不足在于:①提交一个查询往往返回数以千计的结果,有些是相关的,但大多数并不相关,用户需要花费时间和精力去挑选;②只能回答用户询问的问题,不能主动、增量的向用户提供知识。

2.内容过滤:基于商品信息,包括商品的属性及商品之间的相关性和客户的喜恶来向其推荐。基于商品属性主要是基于产品的属性特征模型推荐。例如,对在购物车以往记录中或有多张打折cd的客户就可以向其推荐一些打折cd。基于商品间的关联性是根据客户感兴趣的产品推荐相关的产品。例如,服装的搭配,商品的系列或配套件。内容过滤技术分析商品的属性及其相关性可以脱机进行,所以推荐响应时间快,其弊端在于不能为用户发现新的感兴趣的商品,只能发现和用户已有兴趣相似的商品;不能为新客户形成合适的推荐,因为客户还没有购物经历,基于内容过滤的推荐系统得不到参考输入。

3.协同过滤:基于协同过滤技术的电子商务推荐系统并不分析商品之间的相似性,而是学习目标用户和历史用户之间购买行为的相似性,从而根据相似历史用户的购买行为生成推荐结果。协同过滤技术不需要商品特征的描述,它学习的是用户购买行为之间的相似性,而不依赖商品的特征,因此它可以推荐从表面特征上看上去不同但实际上有很大相关性的商品。所以其优点是:①能为用户发现新的感兴趣的商品;②不需要考虑商品的特征,任何形式的商品都可以推荐。缺点是:①用户对商品的评价非常稀疏,这样基于用户的评价所得到的用户间的相似性可能不准确(即稀疏性问题);②随着用户和商品的增多,系统的性能会越来越低(即可扩展性问题);③如果从来没有用户对某一商品加以评价,则这个商品就不可能被推荐(即最初评价问题)。

四、电子商务推荐系统的实现

电子商务推荐系统的实现过程主要包括推荐输入、推荐分析、推荐输出三部分。

1.推荐输入是为推荐分析提供的数据准备,主要的输入形式有:①隐式浏览输入:如客户的浏览行为在客户不知道的情况下被记录作为推荐系统的输入;②显式浏览输入:客户的浏览行为是有目的向推荐系统提供自己的爱好,如对商品的评价等;③关键词和项目属性输入:客户输入关键词或项目的有关属性以得到推荐系统的有价值推荐;④客户购买历史:客户过去的购买记录。

2.推荐分析是推荐系统的核心部分,所采用的推荐技术决定着推荐系统的性能优劣。在实际应用中,电子商务推荐系统一般采用多种推荐技术的组合,尽量利用各种推荐技术的优点而避免其缺点,提高推荐系统的性能和推荐质量。比如,为了克服协同过滤的稀疏性问题,可以利用用户浏览过的商品预期用户对其他商品的评价,这样可以增加商品评价的密度,再进行协同过滤,从而提高协同过滤的性能。

3.推荐输出是推荐系统基于推荐输入的数据进行有效的推荐分析之后,以适当的形式将推荐结果展示给用户,主要的输出形式有:①建议,典型的如top-n,能够根据客户的喜好向客户推荐最可能吸引客户的n件产品;②预测,系统对给定项目的总体评分;③个体评分,输出其他客户对商品的个体评分;④评论,输出其他客户对商品的文本评价。

五、结束语

电子商务领域中,通过推荐系统实现个性化服务一方面有助于电子商务网站内容和结构自适应性的实现,另一方面在帮助用户快速定位感兴趣的商品的同时也为企业实现了增值。电子商务推荐系统作为有利的分析工具和促销手段,已成为电子商务网站的竞争工具,必将获得广泛的应用和发展。

参考文献:

[1]周惠宏等:推荐技术在电子商务中的运用综述[j].计算机应用研究,2004,(1)

个性化推荐系统篇10

【关键词】 中医药; 知识服务; 知识推荐; 移动互联网; 移动设备

Preliminary Research on TCM Knowledge Recommendation Via Mobile Internet/ YU Tong, MAO Yu-xin, GAO Hong-jie,et al.//Medical Innovation of China,2015,12(36):115-118

【Abstract】 A core problem of knowledge services in Traditional Chinese Medicine (TCM) domain is as follows: in the face of massive knowledge resources, how to automatically find out which ones a user may be interested in so as to realize active knowledge recommendation. Mobile Internet, with its popularity, convenience, and ability to collect personal information, provides an ideal platform to solve this problem. This paper introduced the concept and background of personalized knowledge recommendation, analyzed the current status of TCM knowledge recommendation via mobile Internet, and proposed existing problems and research thoughts.

【Key words】 Traditional Chinese Medicine; Knowledge service; Knowledge recommendation; Mobile internet; Mobile device

First-author’s address:Information Institute of Traditional Chinese Medicine, China Academy of Chinese Medical Sciences, Beijing 100700,China

doi:10.3969/j.issn.1674-4985.2015.36.038

中医药是中华民族优秀文化的一个重要组成部分,它历史悠久,源远流长。数千年来,历代医家在医疗实践中积累了丰富的经验,创立了兼具理论深度和民族特色的中医药知识体系,为中华民放的繁衍昌盛作出了杰出的贡献。随着我国社会从温饱到小康的转型,百姓的生活水平日益提高,开始更加重视生活品质,追求延年益寿,因此对中医养生保健知识产生了日益强烈的兴趣。

近年来,中医药领域的信息化建设取得了长足进展,建设了大量的文献库和数据库,形成了相对完整的中医药科学数据体系[1] 。这些数字化资源中,蕴含着丰富的中医药知识。如何将这些知识资源与人民群众分享,使普通人从中受益,是一个非常重要的问题。基于互联网的中医药知识服务系统能够整合中医临床知识、中医药理论知识、中药方剂知识和中医疾病知识等中医药知识资源,面向网络用户提供中医知识或其他的数字化服务,是在人民群众中普及中医药知识的一种有效手段[2] 。

中医药知识服务系统一般都实现了知识检索功能,能帮助用户从海量的中医药文献和知识资源中迅速找到有关知识[3] 。但知识检索这种服务方式存在固有的局限性。为检出所需的知识,用户必须能够输入正确的检索词。这就要求用户已关注相关主题,并能用正确的医学术语将其表述出来。这对于医学专业人员可能并非难事,但对于普通人往往是一个很大的挑战。普通人很可能忽视了一些与自身健康有关的知识主题,甚至不清楚在网络上存在哪些有用的知识检索服务,因此无法充分获取在知识库中已经存在的知识。

为了弥补知识检索的局限性,可根据用户的特点向其进行主动的知识推送。不同用户对中医药知识的需求不尽相同,但人们往往对与自身体质和健康状况相关的中医药知识更感兴趣。若能根据用户的特点和偏好,向其提供个性化的知识推荐服务,则可更好地满足用户的需要。在下文中,将介绍个性化知识推荐的概念、背景和技术,阐述基于移动互联网的中医知识推荐服务的现状,提出存在的问题和研究思路。

1 个性化中医知识推荐

个性化知识推荐,是指根据用户的特点和偏好,向其提供具有针对性的知识服务。以中医为例,系统可根据用户的中医体质类型,向其推荐与该体质相关的知识;若用户患有某种疾病,则系统可优先提供该疾病的相关知识。为实现个性化知识推荐服务,需要搜集用户的个人信息。这些信息可由用户填写或设定,也可由用户使用行为推定。例如,用户可通过表单填写(或勾选)其所感兴趣的疾病;又如,用户输入的检索词,可反映出其所关心的主题。系统会为每个注册用户构建“用户模型”,用于描述用户的特点和偏好,判断用户的需求。

当用户访问系统时,系统会根据该用户的模型以及系统自身的推荐逻辑,确定针对该用户的知识推荐内容。例如,若系统测出用户属于气虚质,则会基于知识库向用户推荐气虚质适宜的饮食(如当季水果等)。个性化知识推荐方法是知识服务系统中的一项核心技术,它一般具有如下特点。

1.1 可定制性 知识服务根据用户的设定来实现。系统采取“量体裁衣”的策略,向用户提供和推荐具有针对性和相关性的知识,以满足用户的需求。

1.2 主动性 系统不仅被动地响应用户的知识请求,而且会“猜测”用户需要什么,并采用推荐、提醒、个性化知识展示界面等方式主动提供知识服务。

1.3 差异化 系统面向各类用户提供差异化的知识内容,满足用户的不同需求。用户会因自身特点和需求不同,得到不同的用户体验。

个性化知识推荐方法能进一步简化用户利用中医知识的方式和途径,降低中医知识普及的门槛,促进中医知识的共享和传播。

2 推荐系统技术概述

个性化知识推荐服务的后台需要推荐系统(亦称推荐引擎或推荐平台等,Recommender System)的支持。推荐系统能推测用户对某一信息条目的偏好程度,从大量信息中过滤出用户想要的信息[4] 。近年来,推荐系统在电子书店、视频网站以及搜索引擎等各种网络信息系统中得到了极为广泛的应用,成为一项功能强大、价值巨大的信息服务。

推荐系统的核心是其所使用的推荐方法(或称推荐算法)。目前,推荐方法主要包括“协同过滤”(Collaborative Filtering)和“基于内容的过滤”(Content-based filtering)两大类[5] 。协同过滤方法是根据某个用户的行为(对事物的购买、选择或评价等)以及其他用户的类似行为建立模型,再使用该模型预测该用户可能感兴趣的事物[6] 。基于内容的过滤方法是根据事物的特征判断事物之间的相似性,从而向用户推荐更多类似的事物[7] 。

很多其他的人工智能方法也可被应用于推荐系统。例如,主题模型(Topic Model)是能够从大量离散数据集中挖掘出隐含的主题结构的一类统计模型[8] 。这里的“主题”是指由一些语义相关的特征构成的、用来描述一个话题的抽象概念。利用主题模型可以识别一份文档所表达的主题,从而将该文档推荐给对相关主题感兴趣的用户。又如,社会网络分析 通过网络模型体现一类人群中个体之间的多层次交互关系。通过社会网络分析,可以发现人与人之间的爱好、生活习惯等相似关系,以此为基础对用户做相应的个性化推荐[9]。再如,利用关联规则挖掘(Association Rule Mining)算法,可从海量数据中发现事物之间的关联关系,然后据此进行相应的推荐[10] 。关联规则是形如XY的蕴涵式,具有一定的支持度和信任度。基于关联规则的推荐是以关联规则为基础,若用户特征满足规则头,则将规则体的内容作为推荐对象推荐给用户。

上述推荐方法都是基于统计的,试图从海量数据中挖掘用户的偏好和需求。“基于知识的推荐系统”(knowledge based recommenders)与这些方法不同,它不是基于海量数据分析的结果进行推荐的,而是基于事物分类、用户偏好、推荐原则等方面的显性知识的一种推理技术[11] 。基于知识的推荐方法因它们所用的“效用知识”(Functional Knowledge)的不同而有明显区别。效用知识是一种关于一个事物如何满足某一特定用户的知识,因此能解释需要和推荐的关系。效用知识可以是任何能支持推理的知识结构,它可以是用户已经规范化的查询,也可以是一个更详细的用户需要的表达式。此类方法可以在“协同过滤”和“基于内容的过滤”等方法不适用的领域发挥作用。其优点是不依赖于大量的数据积累,因此容易启动;其缺点是在定义推荐所需知识的过程中可能遇到知识获取瓶颈。

既然推荐系统已被成功应用于商业领域的商品关联推荐,它也就可能被用于中医知识的个性化推荐。可综合利用上述方法,研制面向中医药领域的个性化知识推荐系统,使之能够利用用户个人健康信息、人际网络信息和健康公共信息,向用户提供有用的知识和有效的建议,帮助用户决定应该进行什么有益的饮食规划、生活活动或疾病治疗规划,达到疾病防治和提高生活质量的效果。一个面向中医知识的个性化推荐系统将能够实时利用采集到的数据做出主动推荐,提高用户的疾病防治能力及其对中医知识的信赖度。

3 移动互联网和中医知识推荐

近年来,智能手机等移动设备迅速普及,移动互联网取得迅猛发展[12] 。移动互联网因其普及性、便捷性以及强大的个人信息采集和自动感知能力,为个性化知识推荐提供了理想的平台。首先,智能终端为用户个人健康信息的采集提供了便捷的手段,可通过规范化的问卷、量表采集用户个人健康数据并判断其健康状况。例如,可以基于中华中医药学会的《中医体质分类与判定》等标准,为用户提供“中医体质测试”服务;系统会列出一组与用户近期的体验和感觉相关的问题,根据用户的答案判断出用户的中医体质类型。其次,基于智能终端的传感系统自动采集时间、地域、天气等用户相关数据,这种用户情境感知能力能进一步提升推荐系统的精准性。例如,通过GPS系统,可感知用户的地理位置,据此推荐当地的美食,而无需推荐在当地不存在的食材及相关食谱。最后,智能终端为个性化中医知识推荐提供了移动应用程序、万维网、短信、微信等多种实现途径。

在中医药领域,已出现了过日子、中医养生、健康养生宝典、365健康养生、中华养生、中医美容保健、养生美颜听书等一系列面向社会大众提供知识服务的移动APP。许多产品会收集用户行为信息和健康数据,据此向用户提供知识推荐等个性化服务。例如,“过日子”会提请用户进行注册并填写个人健康信息,并根据用户“中医体质测试”的结果判断用户的中医体质,进而针对用户的体质类型提供个性化的知识推荐服务;“中华养生”以中医理论为依据,实现了养生提醒功能,适时推荐运动、食疗、调神等方面的养生知识,督促用户从事养生保健活动;“中医养生钟(普及版)”根据时辰(时间)与脏器经络的对应关系为用户提供养生提醒服务;“体质养生(食疗)系统”根据用户“中医体质测试”的结果提供个性化知识推荐,帮助用户在选择食物时能根据自身体质去分析营养价值,而不仅根据喜好[13] 。上述产品有助于用户获得日常健康维护、疾病预防和生活指导等方面的中医知识,指导并督促用户从事养生保健活动,以达到增强体质、预防疾病、颐养生命之目的。

4 存在的问题和研究思路

上述产品已初步实现了个性化中医知识推荐功能,但尚有改进空间。存在的主要问题是知识权威性和用户信任度较低[14] 。中医学术界多年来开展了大量的中医药信息化工作,组织全国一流专家进行数据库加工,建设了大量的中医药数据库[1] 。通过建立严格数据质量评价标准以及数据审校机制,保证了数据质量[15] 。这些数据库具有领域权威性,知识可信度高,为中医知识推荐服务提供了优质资源。需要研究如何对这些知识资源进行有效组织,并与用户对中医知识需求建立关联,使这些知识资源能更有效地支持推荐服务。

另外,上述产品的推荐机制的合理性尚未得到专家的论证,在推荐技术和方法方面尚有进一步研发和改进的空间。可根据个体化健康状态,以实时健康风险评估为基础,研究智能健康信息推荐技术,开发个性化中医知识推荐系统,即时提供满足百姓日常健康维护、疾病预防和生活指导方面的中医知识。其中涉及3项主要的研究内容。

4.1 用户个人健康信息模型的研究与设计 为实现个性化的知识推荐,首先需要设计符合移动互联网技术特点且具有中医特色的用户个人健康信息模型。需要对基于移动互联网的用户个体数据采集手段进行调研,分析现有的个人健康数据的内容、质量和利用价值,对用户的个体特征进行系统梳理和量化建模,形成一个相对完善的、领域相关的用户特征模型。

4.2 个性化中医知识推荐算法研究与实现 首先,可通过文献调研、专家咨询、用户访谈等方法,整理个性化中医药知识推荐的案例,明确知识推荐策略。进而,可采用知识表示技术,构建一个面向中医知识推荐的规则库,将推荐策略表达为形式化的知识推荐规则,从而建立个人健康信息模型与中医药知识资源之间的关联关系,实现基于规则的中医知识推荐。最后,可采用“基于知识的推荐”与“协同过滤”相结合的混合型推荐机制,研究和实现专门针对中医知识的个性化推荐算法。

4.3 中医知识主动推送网络服务的研究与实现 在研究和实现推荐算法的基础之上,需要进一步对该算法进行网络化封装,在万维网(Web)服务器端实现和部署知识推荐的网络服务(Web Service),使得移动客户端和其他信息系统都能动态调用知识推荐算法。该服务能够直接根据用户特征向移动客户端推送中医知识,从而实现基于移动互联网的个性化知识推荐。

5 小结

知识推荐与知识检索是知识服务的两种基本方式:知识推荐属于系统主动推送,知识检索属于用户主动提取。这两种方式相辅相成,相互融合,可以形成相对完整的中医知识服务技术方案,进一步提升知识服务系统的用户友好性和针对性。移动互联网的发展以及智能终端的迅速普及,使具有用户情境感知能力的个性化推荐系统成为可能。“过日子”等移动应用产品已初步实现了个性化中医知识推荐功能,可根据用户的个人健康信息(如性别、年龄、体质、疾病等)以及时节、地域等环境信息,进行个性化的中医知识推荐,使用户可以随时随地获得针对自己和家人的养生知识和健康提示。需要基于中医药领域现有的优质数据资源,采用移动互联网技术,设计用户个人健康信息模型,研制权威的中医知识库以及智能化的中医知识推荐技术,实现中医知识主动推送网络服务,帮助普通百姓获得精准的个性化中医知识服务,从而提高用户的疾病防治能力以及对中医知识的信赖度。

参考文献

[1] 崔蒙,尹爱宁,范为宇,等.中医药科学数据建设研究进展[J].中国中医药信息杂志,2006,13(11):104-105.

[2] 高博, 崔蒙, 杨硕,等. 基于数据的中医药知识服务研究[J]. 图书情报工作, 2012, 56(9): 5-9.

[3] 于彤, 苏大明, 尹仁芳, 等. 中医药知识服务平台构建研究[J]. 中国医学创新, 2014, 11(15):120-123.

[4] Francesco Ricci, Lior Rokach, Bracha Shapira. Introduction to recommender systems [M]. Handbook, Recommender Systems Handbook, Springer, 2011:1-35.

[5] Hosein Jafarkarimi, Alex Tze Hiang Sim, Robab Saadatdoost. A Na?ve Recommendation Model for Large Databases [J]. International Journal of Information and Education Technology, 2012, 2(3):216-219.

[6] Prem Melville, Vikas Sindhwani. Recommender systems [M]. Encyclopedia of Machine Learning, 2010.

[7] Mooney R J, Roy L. Content-based book recommendation using learning for text categorization [C]. In Workshop Recom. Sys.: Algo. and Evaluation, 1999.

[8] David M Blei. Introduction to probabilistic topic models [J]. Comm. ACM, 2012, 55(4): 77-84.

[9] John P Scott. Social network analysis:a handbook (2nd edition)[M]. Thousand Oaks, CA: Sage Publications, 2000.

[10] Hipp J, Güntzer U, Nakhaeizadeh G. Algorithms for association rule mining - a general survey and comparison [J]. ACM SIGKDD Explorations Newsletter, 2000, 52(2): 58.

[11] Burke R. Knowledge-based recommender systems [J]. Encyclopedia of Library and Information Science, 2000, 69(32):180-200.

[12] 罗军舟,吴文甲,杨明,等. 移动互联网:终端、网络与服务[J]. 计算机学报,2011,34(11):2029-2051.

[13] 胡奥杰. 基于android的体质养生系统的开发[J]. 电子世界,2014,20(7):112-113.

[14] 朱毓梅. 中医药信息需求的调查分析[J]. 国际中医中药杂志,2014,36(9):830-832.