推荐系统范文10篇

时间:2023-04-05 16:39:57

推荐系统

推荐系统范文篇1

该同志具有较高的政治素质,扎实的理论功底,又有较丰富的实践经验,业务能力很强。从事邮电工作17年来,无论在哪个岗位上工作,都能做到敬业爱岗、认真钻研、勇于创新,工作成绩都十分突出。其主要表现有:

一、****年至****年任储汇分局局长的三年期间,邮储余额增长了**个亿,刷新了株洲邮储业务发展的最高纪录;同时,他还致力于邮储中间业务的发展,通过制定一系列中间业务发展的激励措施,让株洲邮储中间业务步入了良性快速发展的轨道。****年邮储网点代收话费达到了***个亿,市场占有率由原来的22%上升到30%;***年保险业务***万元,取得了我局保险以来最好业绩。

二、***元月开始任***区局区局长,上任伊始,他针对区局业务发展确定了“一月一突破”,所有业务“均衡发展”的经营模式。其邮储业务从元月开始,增长速度一直处于“领跑者”地位,同时其它重点业务的发展也齐头并进。他重点抓好了窗口营销的“三个转变”,即普包转快包、挂号转特快、普通汇款转新业务汇款,取得了很好成效。其电子汇兑新业务占比达到80.58%,所辖的火车站支局新业务比重高达99.3%,区局仅此一项每月增收7.73万元,快包占比届提高了近40个百分点,每月增收4万元,我局把***区局成功经验和现形做法在全区进行了推广,其他区局和县局纷纷借鉴,使我局2004年汇兑业务在开发张数和开发金额都大幅下降的情况下,保持了收入与去年持平,包件业务在专项整治之后虽然业务量下降,业务收入也保持了持平。

三、2004年6月份该同志根据组织安排,离开已打下良好基础的***局局长职务,到市场经营部任经营部主任。他更是利用自己拥有的专业知识和实际工作经验,多次成功地策划了业务营销活动,取得了非常可观的经济效益,其中有多项营销项目为我局业务发展史上首创。

(一)、筹备召开“产品说明会”,使我局的大客户营销工作踏上了一个新台阶。

我局在每年一度的“世界邮政日”要针对大客户单位召开的“大客户答谢会”,今年,35届“出界邮政日”来临之机,****同志大胆地提也了把以用邮大客户为目标对象改为以对所有邮政服务和邮政产品有潜在需求的用户为目标对象,分别召开帐单、速递、集邮、邮储、票务等七场产品说明会,这是我局对外展示邮政服务产品和邮政实力一次有益尝试,并取得了理想效果。通过本次产品成本说明会,我们的个性化邮品、商业信函、帐单、邮送广告和广告明信片达到一个广而告之的市场效果,各与会来宾对邮政新业务产品产生浓厚兴趣,并提出了一些业务的合作意向。会后,对这些意向单位进行了分类,并明确了专人负责跟进,为我局的大客户营销工作踏上了一个新台阶。

(二)、实施组建个性化投递队伍的构想,为我局报刊、商函业务的发展奠定了坚实基础。

2004年,他针对我局现有投递网络不能全方位满足客户的个性化服务要求的现状,提出了组建了个性化投递队伍的设想,并制订出“一个办法、三种考核”的运作模式。10月,我局的个性化投递队伍正式开始运作,30名投递员划分10个投递段,以《东方新报》为支撑,负责全市商函、帐单、邮送广告的分发、投递和夹报工作,实行上楼、入户、入门面、入摊位投递,个性化投递队伍以其高度负责的服务态度、无微不至的服务品质,赢来了客户的信任和合作,全面提高了我局邮政投递网络适应市场需求的能力。目前通过个性化投递队伍投递的《东方新报》12000份,为企业带来近40万元的收入。

(三)、以项目经理制强化了专业营销,以项目营销推动大客户营销工作,全面提升了我局的专业营销水平。

2004年6月,为进一步激励专业营销人员的创收积极性,他确定了以项目经理制强化专业营销的经营思路,要求每个专业要明确自由自在开发的项目,确定专人为项目经理,带动市县联动发展。同时每周对各营销项目进展情况进行通报,对完成情况给予奖罚,从而使我局专业化经营工作落到了实处。运作几个月以来,大部分项目已取得了成效。

如邮资封项目的成功运作有效地弥补了我局今年以来函件业务的欠产缺口,全区完成134万枚,使我局函件业务收入完成了526万元,完成了全年函件业务收入计划的117%,排名全省第一。

如针对移动、电信、银行、保险等服务性行业都拥有一批VIP客户的特点,为这些单位制定了其VIP客户赠送报刊的方案,并顺利实施,为我局新增畅销报刊10000份,其中高费率的《东方新报》达到了8000份以上。

如我局的金卡营销项目围绕“增加有效收入”为中心,他在提出了按比例折算的考核方案,充分调动了各营销单位的积极性的同时,对各单位提出了要由简单营销、熟人营销向方案营销转变的要求。我局2004年完成企业金卡收入40万元,比去年同期增幅120%。

以上营销项目成功动作,创下了了我局最佳专业营销业绩,使我局的专业营销水平踏上了一个新台阶。

鉴于该同志的业务管理水平、创新能力、工作实绩,经综合考评,同意推荐****同志为优秀营销人才

推荐系统范文篇2

实践经验,业务能力很强。从事邮电工作17年来,无论在哪个岗位上工作,都能做到敬业爱岗、认真钻研、勇于创新,工作成绩都十分突出。其主要表现有:

一、****年至****年任储汇分局局长的三年期间,邮储余额增长了**个亿,刷新了株洲邮储业务发展的最高纪录;同时,他还致力于邮储中间业务的发展,通过制定一系列中间业务发展的激励措施,让株洲邮储中间业务步入了良性快速发展的轨道。****年邮储网点代收话费达到了***个亿,市场占有率由原来的22上升到30;***年保险业务***万元,取得了我局保险以来最好业绩。

二、***元月开始任***区局区局长,上任伊始,他针对区局业务发展确定了“一月一突破”,所有业务“均衡发展”的经营模式。其邮储业务从元月开始,增长速度一直处于“领跑者”地位,同时其它重点业务的发展也齐头并进。他重点抓好了窗口营销的“三个转变”,即普包转快包、挂号转特快、普通汇款转新业务汇款,取得了很好成效。其电子汇兑新业务占比达到80.58,所辖的火车站支局新业务比重高达99.3,区局仅此一项每月增收7.73万元,快包占比届提高了近40个百分点,每月增收4万元,我局把***区局成功经验和现形做法在全区进行了推广,其他区局和县局纷纷借鉴,使我局20*年汇兑业务在开发张数和开发金额都大幅下降的情况下,保持了收入与去年持平,包件业务在专项整治之后虽然业务量下降,业务收入也保持了持平。

三、20*年6月份该同志根据组织安排,离开已打下良好基础的***局局长职务,到市场经营部任经营部主任。他更是利用自己拥有的专业知识和实际工作经验,多次成功地策划了业务营销活动,取得了非常可观的经济效益,其中有多项营销项目为我局业务发展史上首创。

(一)、筹备召开“产品说明会”,使我局的大客户营销工作踏上了一个新台阶。

我局在每年一度的“世界邮政日”要针对大客户单位召开的“大客户答谢会”,今年,35届“出界邮政日”来临之机,****同志大胆地提也了把以用邮大客户为目标对象改为以对所有邮政服务和邮政产品有潜在需求的用户为目标对象,分别召开帐单、速递、集邮、邮储、票务等七场产品说明会,这是我局对外展示邮政服务产品和邮政实力一次有益尝试,并取得了理想效果。通过本次产品成本说明会,我们的个性化邮品、商业信函、帐单、邮送广告和广告明信片达到一个广而告之的市场效果,各与会来宾对邮政新业务产品产生浓厚兴趣,并提出了一些业务的合作意向。会后,对这些意向单位进行了分类,并明确了专人负责跟进,为我局的大客户营销工作踏上了一个新台阶。

(二)、实施组建个性化投递队伍的构想,为我局报刊、商函业务的发展奠定了坚实基础。

20*年,他针对我局现有投递网络不能全方位满足客户的个性化服务要求的现状,提出了组建了个性化投递队伍的设想,并制订出“一个办法、三种考核”的运作模式。10月,我局的个性化投递队伍正式开始运作,30名投递员划分10个投递段,以《东方新报》为支撑,负责全市商函、帐单、邮送广告的分发、投递和夹报工作,实行上楼、入户、入门面、入摊位投递,个性化投递队伍以其高度负责的服务态度、无微不至的服务品质,赢来了客户的信任和合作,全面提高了我局邮政投递网络适应市场需求的能力。目前通过个性化投递队伍投递的《东方新报》12000份,为企业带来近40万元的收入。

(三)、以项目经理制强化了专业营销,以项目营销推动大客户营销工作,全面提升了我局的专业营销水平。

20*年6月,为进一步激励专业营销人员的创收积极性,他确定了以项目经理制强化专业营销的经营思路,要求每个专业要明确自由自在开发的项目,确定专人为项目经理,带动市县联动发展。同时每周对各营销项目进展情况进行通报,对完成情况给予奖罚,从而使我局专业化经营工作落到了实处。运作几个月以来,大部分项目已取得了成效。

如邮资封项目的成功运作有效地弥补了我局今年以来函件业务的欠产缺口,全区完成134万枚,使我局函件业务收入完成了526万元,完成了全年函件业务收入计划的117,排名全省第一。

如针对移动、电信、银行、保险等服务性行业都拥有一批VIP客户的特点,为这些单位制定了其VIP客户赠送报刊的方案,并顺利实施,为我局新增畅销报刊10000份,其中高费率的《东方新报》达到了8000份以上。

如我局的金卡营销项目围绕“增加有效收入”为中心,他在提出了按比例折算的考核方案,充分调动了各营销单位的积极性的同时,对各单位提出了要由简单营销、熟人营销向方案营销转变的要求。我局20*年完成企业金卡收入40万元,比去年同期增幅120。

以上营销项目成功动作,创下了了我局最佳专业营销业绩,使我局的专业营销水平踏上了一个新台阶。

推荐系统范文篇3

关键词:推荐系统;生物信息学

推荐系统(RecommenderSystem)[1]是个性化信息服务的主要技术之一,它实现的是“信息找人,按需服务”;通过对用户信息需要、兴趣爱好和访问历史等的收集分析,建立用户模型,并将用户模型应用于网上信息的过滤和排序,从而为用户提供感兴趣的资源和信息。生物信息学(Bioinformatics)[2,3]是由生物学、应用数学和计算机科学相互交叉所形成的一门新型学科;其实质是利用信息科学的方法和技术来解决生物学问题。20世纪末生物信息学迅速发展,在信息的数量和质量上都极大地丰富了生物科学的数据资源,而数据资源的急剧膨胀需要寻求一种科学而有力的工具来组织它们,基于生物信息学的二次数据库[4]能比较好地规范生物数据的分类与组织,但是用户无法从大量的生物数据中寻求自己感兴趣的部分(著名的生物信息学网站NCBI(美国国立生物技术信息中心),仅仅是小孢子虫(Microsporidia)的DNA序列就达3399种),因此在生物二次数据库上建立个性化推荐系统,能使用户快速找到自己感兴趣的生物信息。特别是在当前生物信息数据量急剧增长的情况下,生物信息学推荐系统将发挥强大的优势。

1推荐系统的工作流程

应用在不同领域的推荐系统,其体系结构也不完全相同。一般而言,推荐系统的工作流程[5]如图1所示。

(1)信息获取。推荐系统工作的基础是用户信息。用户信息包括用户输入的关键词、项目的有关属性、用户对项目的文本评价或等级评价及用户的行为特征等,所有这些信息均可以作为形成推荐的依据。信息获取有两种类型[6],即显式获取(Explicit)和隐式获取(Implicit),由于用户的很多行为都能暗示用户的喜好,因此隐式获取信息的准确性比显式高一些。

(2)信息处理。信息获取阶段所获得的用户信息,一般根据推荐技术的不同对信息进行相应的处理。用户信息的存储格式中用得最多的是基于数值的矩阵格式,最常用的是用m×n维的用户—项目矩阵R来表示,矩阵中的每个元素Rij=第i个用户对第j个项目的评价,可以当做数值处理,矩阵R被称为用户—项目矩阵。

(3)个性化推荐。根据形成推荐的方法的不同可以分为三种,即基于规则的系统、基于内容过滤的系统和协同过滤系统。基于规则的推荐系统和基于内容过滤的推荐系统均只能为用户推荐过去喜欢的项目和相似的项目,并不能推荐用户潜在感兴趣的项目。而协同过滤系统能推荐出用户近邻所喜欢的项目,通过用户与近邻之间的“交流”,发现用户潜在的兴趣。因此本文所用的算法是基于协同过滤的推荐算法。

(4)推荐结果。显示的任务是把推荐算法生成的推荐显示给用户,完成对用户的推荐。目前最常用的推荐可视化方法是Top-N列表[7],按照从大到小顺序把推荐分值最高的N个事物或者最权威的N条评价以列表的形式显示给用户。

2生物信息学推荐系统的设计

综合各种推荐技术的性能与优缺点,本文构造的生物信息学推荐系统的总体结构如图2所示。

生物信息学推荐系统实现的主要功能是在用户登录生物信息学网站时,所留下的登录信息通过网站传递到推荐算法部分;推荐算法根据该用户的用户名从数据库提取出推荐列表,并返回到网站的用户界面;用户访问的记录返回到数据库,系统定时调用推荐算法,对数据库中用户访问信息的数据进行分析计算,形成推荐列表。

本系统采用基于近邻的协同过滤推荐算法,其结构可以进一步细化为如图3所示。算法分为邻居形成和推荐形成两大部分,两部分可以独立进行。这是该推荐系统有别于其他系统的优势之一。由于信息获取后的用户—项目矩阵维数较大,使得系统的可扩展性降低。本系统采用SVD矩阵降维方法,减少用户—项目矩阵的维数,在计算用户相似度时大大降低了运算的次数,提高了推荐算法的效率。

(1)信息获取。用户对项目的评价是基于用户对某一个项目(为表示简单,以下提及的项目均指网站上的生物物种)的点击次数来衡量的。当一个用户注册并填写好个人情况以后,系统会自动为该用户创建一个“信息矩阵”,该矩阵保存了所有项目的ID号以及相应的用户评价,保存的格式为:S+编号+用户评价,S用于标记项目,每个项目编号及其评价都以“S”相隔开;编号是唯一的,占5位;用户评价是用户点击该项目的次数,规定其范围是0~100,系统设定当增加到100时不再变化。这样做可防止形成矩阵时矩阵评价相差值过大而使推荐结果不准确。(2)信息处理。信息处理是将所有用户的信息矩阵转换为用户—项目矩阵,使用户信息矩阵数值化,假设系统中有M个用户和N个项目,信息处理的目的就是创建一个M×N的矩阵R,R[I][J]代表用户I对项目J的评价。

(3)矩阵处理。协同过滤技术的用户—项目矩阵的数据表述方法所带来的稀疏性严重制约了推荐效果,而且在系统较大的情况下,它既不能精确地产生推荐集,又忽视了数据之间潜在的关系,发现不了用户潜在的兴趣,而且庞大的矩阵增加了计算的复杂度,因此有必要对该矩阵的表述方式做优化,进行矩阵处理。维数简化是一种较好的方法,本文提出的算法应用单值分解(SingularValueDecomposition,SVD)技术[8],对用户—项目矩阵进行维数简化。

(4)相似度计算。得到降维以后的用户矩阵US,就可以寻找每个用户的近邻。近邻的确定是通过两个用户的相似度来度量的。本文采用Pearson相关度因子[9]求相似度。(5)计算用户邻居。该方法有两种[10],即基于中心的邻居(Center-BasedNeighbor)和集合邻居(AggregateNeighbor)。本系统采用了第一种方法,直接找出与用户相似度最高的前N个用户作为邻居,邻居个数N由系统设定,比如规定N=5。

(6)推荐形成。推荐形成的前提是把当前用户的邻居ID号及其与当前用户的相似度保存到数据库中,而在前面的工作中已找出各用户的邻居以及与用户的相似度,推荐形成部分只需要对当前登录用户进行计算。推荐策略是:对当前用户已经访问过的项目不再进行推荐,推荐的范围是用户没有访问的项目,其目的是推荐用户潜在感兴趣的项目;考虑到系统的项目比较多,用户交互项目的数量很大,所以只筛选出推荐度最大的N个项目,形成Top-N推荐集,设定N=5。

3生物信息学推荐系统的实现

生物信息学推荐系统的实现可以用图4来表示。数据库部分主要存储用户信息和项目信息,用SQLServer2000实现。

数据访问层实现了与用户交互必需的存储过程以及触发器,也使用SQLServer2000,主要完成以下功能:初始化新用户信息矩阵;插入新项目时更新所有用户的信息矩阵;用户点击项目时更新该用户对项目的评价;删除项目时更新所有用户的信息矩阵。用户访问层主要涉及网页与用户的交互和调用数据访问层的存储过程,在这里不做详细的介绍。

推荐算法完成整个个性化推荐的任务,用Java实现。(1)数据连接类DataCon。该类完成与SQLServer2000数据库的连接,在连接之前必须要下载三个与SQLServer连接相关的包,即msutil.jar、msbase.jar和mssqlserver.jar。

(2)数据操作类DataControl。该类负责推荐算法与数据库的数据交换,静态成员Con调用DataCon.getcon()获得数据库连接,然后对数据库进行各种操作。把所有方法编写成静态,便于推荐算法中不创建对象就可以直接调用。

(3)RecmmendSource与CurrentUserNeighbor。这两个类作为FCRecommand类的内部类,RecmmendSource用于保存当前用户的推荐列表,包括推荐项目号和推荐度;CurrentUserNeighbor用于保存邻居信息,包括邻居ID号、相似度及其访问信息。

(4)协同过滤推荐算法FCRecommand。该类实现了整个推荐算法,主要分为邻居形成方法FCArithmetic和推荐形成方法GenerateRecommend。

下面给出方法FCArithmetic的关键代码:

Matrixuser_item=this.User_Item_Arry();//获取用户—项目矩阵

user_item=this.SVD_Calculate(user_item);//调用SVD降维方法

Vectorc_uservector=newVector();//当前用户向量

Vectoro_uservector=newVector();//其他用户向量

Vectorc_user_correlate_vector=newVector();

//当前用户与其他用户之间相似度向量

for(inti=0;ifor(intj=0;jc_uservector.addElement(user_item.get(i,j));

//1.获得当前用户向量

for(intk=0;ko_uservector.clear();

for(intl=0;lo_uservector.addElement(user_item.get(k,l));

//2.获得其他用户的向量

//3.计算当前用户与其他用户的相似度

usercorrelativity=this.Correlativity(c_uservector,o_uservector);

c_user_correlate_vector.addElement(usercorrelativity);

}

//4.根据当前用户与其他用户的相似度,计算其邻居

this.FindUserNeighbor(i,c_user_correlate_vector);

}

根据邻居形成方法FCArithmetic,可以得到每个用户的邻居。作为测试用例,图6显示用户Jack与系统中一部分用户的相似度,可以看出它与自己的相似度必定最高;并且它与用户Sugx访问了相同的项目,它们之间的相似度也为1,具有极高的相似度。

4结束语

在传统推荐系统的基础上,结合当前生物信息学网站的特点,提出一个基于生物信息平台的推荐系统,解决了传统生物信息网站平台信息迷茫的缺点,为用户推荐其感兴趣物种的DNA或蛋白质序列。

优点在于协同过滤的推荐算法能发现用户潜在的兴趣,能促进生物学家之间的交流;推荐算法的邻居形成与推荐形成两部分可以单独运行,减少了系统的开销。进一步的工作是分析生物数据的特点及生物数据之间的关系,增加用户和项目数量,更好地发挥推荐系统的优势。

参考文献:

[1]PAULR,HALRV.Recommendersystems[J].CommunicationsoftheACM,1997,40(3):56-58.

[2]陈新.生物信息学简介[EB/OL].(2001).166.111.68.168/bioinfo/papers/Chen_Xin.pdf.

[3]林毅申,林丕源.基于WebServices的生物信息解决方案[J].计算机应用研究,2005,22(6):157-158,164.[4]邢仲璟,林丕源,林毅申.基于Bioperl的生物二次数据库建立及应用[J].计算机系统应用,2004(11):58-60.

[5]AIRIAS,TAKAHISAA,HIROYAI,etal.Personalizationsystembasedondynamiclearning:InternationalSemanticWebConference[C].Sardinia:[s.n.],2002.

[6]BREESEJS,HECKERMAND,KADIEC.Empericalanalysisofpredictivealgorithmsforcollaborativefiltering:proceedingsoftheFourteenthConferenceonUniversityinArtificialIntelligence[C].Madison:WI,1998:43-52.

[7]SCHAFERJB,KONSTANJ,RIEDLJ.Recommendersystemsine-commerce:proceedingoftheACMConferenceonElectronicCommerce[C].Pittsburgh:PA,1999:158-166.

[8]PRYORMH.Theeffectsofsingularvaluedecompositiononcollaborativefiltering[EB/OL].(1998).www.cs.dartmouth.edu/reports/TR98-338.pdf.

推荐系统范文篇4

【关键词】智能推荐系统;个性化;数据挖掘;应用

互联网技术的不断发展与革新,致使数字化家庭这一概念已然成为现实。就当前而言,人们在运用互联网技术进行观影、购物以及看书等日常活动时,越来越希望各项app或网页能够为自身推荐具有个人偏好的信息。一般来说,智能推荐系统的成功运用是通过把不同用户的个人信息或个人偏好与特殊的参数数据相比较,得出相对客观的结论,进而预测用户对于一些未接触项目的喜好程度。这里所说的参数数据不是一个特定的元素,即可能是用户所处的社会环境与社交关系,也可能是从用户曾经接触过的类似项目中得出。

1.系统构成

本文中所涉及的网络影视智能推荐系统具有两个重要目标,其一是能够依据不同用户的行为喜好,从海量的影视数据库中筛选出适宜的影视推荐项目;其二是能够实时、迅捷为用户更新偏好信息。为了将这两个目标变为现实,本文将构成一个三层应用处理的系统。即当系统收到用户发出的请求时,系统接口就会迅速将用户的请求发送至系统的中间层,随后位于中间层的搜索引擎就会迅速作出反应,并根据用户的各项偏好信息与自身影视媒体库的内容进行分析处理,最后再把分析出的数据内容制定成推荐列表传回给用户。用户在收到由智能推荐系统所推荐的影视数据时,可以通过点击试看或预览影视介绍等方式,决定是否采纳观看系统所推荐内容。只要用户确定其所偏好的内容,系统就会利用自身的索引技术为用户提供相应的影视资源[1]。总而言之,该系统主要由三子系统所组成。1.1管理员子系统。该子系统主要执行影视数据库的资料进行实时更新、定期删减与管理用户信息等任务,进而保障该系统搜索引擎的时效性,使之能够迅速完善参数设置,改善相应的关联机制。1.2用户信息处理子系统。该子系统主要管理用户的个人信息档案,例如用户的民族、性别、职业、社交与年龄等等。除此之外,该系统还将管理个人用户的交易信息,为用户提供相应的注册、充值与登录等服务。1.3推荐子系统推荐子系统是管理关联机制的重要力量,通过与其他子系统的相互配合,迅速为用户推荐出具有个性化与智能化的影视推荐项目。该系统的构建是基于资料搜索技术的,并结合了不同用户的交易信息与个人基础信息库。

2.系统方案

以上述系统构成为基础,整个系统实质分为客户端程序与推荐程序两个部分组成,下面将分别阐述两大程序。2.1客户端程序。智能推荐系统的客户端程序主要由两项重要技术作为其支撑点。2.1.1智能化的自主学习技术。当用户在互联网上选择影视作品进行观看时,必然有一个筛选与点击的过程,这个时候客户端程序就能根据不同影视作品的点击频率或不同用户主体的选择偏好与规律,学习用户不同的偏好习惯或点击特性。客户端在对用户进行影视作品推荐时,必须要找出影视作品内容与用户本身的关联性[2]。根据此,影视作品的信息、用户自身的档案资料与消费记录之间,必须引入客观正确的关联机制。通过关联机制发现三者之间存在的客观规律,能够推进搜索引擎的使用效力,并能够更加快捷有效地整和诸项信息,得出较为正确恰当的规则信息。其中规则有效形式的产生必然是通过挖掘推导用户的个性化数据而得出的。通过此种方式,就能让用户在登录客户端时,推荐系统就能迅速作出处理,调用自身的规则数据库。经历适用程序后定能为用户推荐出适宜的影视信息资料。2.1.2智能化的特性分析技术。对于特性分析技术而言,其目的是为了探寻出影视作品内容与用户本身个性化需求的联系。其运行规则主要分为两个部分,即形式多样、内容自由的用户个人信息以及自由组合的影视作品资料。这里的用户个人信息主要包含性别、岁数、星座属相、职业与兴趣爱好等方面,而影视作品资料主要是作品导演、男一号、女一号等内容。通过收集整理这些数据能够在系统中形成较为客观的关联机制[3]。2.2智能推荐程序。2.2.1基本内涵。结合全文我们不难得出,智能推荐程序主要是为了在海量的信息中,对各项因素进行分析处理,并运用相应的规则机制,进而作出正确的信息供应。依据影视作品的相应特性,可以将影视资源的筛选推荐与排序选择建立在用户未看过的基础上,另外影视作品的新旧特性也是程序进行排序、推荐的重要依据内容,将新兴的影视作品放在优先推荐地位较为符合现代人的审美与喜好。最后,影视作品的点击率也是评判其排序顺序的重要依据,通常情况下,将点击率较高的影视作品放入推荐作品的优先级地位也是符合客观规律的。2.2.2程序设用逻辑。输入:用户信息、用户消费记录、影视作品资料、关联机制。输出:≤十五部推荐影视作品(根据实际情况)。首先,当用户利用互联网技术登录到我们的系统后,系统将会依据用户的登录情况判定用户是新兴用户还是老用户。如果该用户是第一次用该系统,那么系统就会根据用户所提供的个人信息寻找内部是否有适宜的关联机制,若是系统能够成功寻找出对应的关联机制,就会通过内部关联机制寻找出适合用户的≤十五部影视作品进行推荐,。但是如果系统内部没有与用户个人信息所对应的关联机制,系统就将为用户推荐当下最为热门的十五部影视作品[4]。再者,当用户登录系统后,登录信息现实该用户为本系统的老用户,那么这个时候系统也将主动寻找是否有与该老用户相对应的关联机制,与新用户不同的是,当系统寻找到与该老用户对应的关联机制,并为该用户筛选出适宜的≤十五部影视作品时,还将进一步分析该老用户的消费记录,根据用户消费偏好,然后再为老用户推荐适宜的作品。如果系统未能找到与该老用户相匹配的关联机制,那么系统就将直接分析该老用户的消费偏好,进而为用户推荐相对适宜的≤十五部影视作品。系统利用关联机制分析出不同用户的观影喜好时,还需要进一步判断其具体内容与种类,然后才从类似的影视作品中寻找出符合筛选与排序原则的推荐作品。消费记录是智能推荐系统为用户推荐何种影视作品的重要依据。故此,系统首先就需要从用户的消费记录中寻找到用户最为喜欢的几种影视作品类型,除此之外,用户的偏爱型影视作品也是需要系统作统计分析的,例如有多部用户曾看过的影视作品都由某一位演员出演,系统就可以对那位演员所出演的影视作品作类型分析,然后在于之前所选出的几种影视作品类型相对比,将与之前类型影视作品的类型单独分出来,形成一个新兴推荐影视作品类型,随之再根据比例关系合理分配不同类型影视作品数目,并最终推荐给用户。在本系统中,如何在同一类型影视作品中挑选出适宜的几个影视作品同样需要遵循相关规则,以求智能化的深入。面对这个问题,我们借助前文可以发现,当同一类型的影视作品中出现了用户所偏爱的演员时,有用户偏爱演员的作品当然被列入优先级,但是如果同一类型中并为出现用户所偏爱的演员,则需要遵循筛选与排序原则进行智能化影视作品推荐。除此之外,如果系统分析出的用户喜好影视作品类型根本就没有其所偏爱的演员出演,那就可以直接利用不同类型影视作品总数量的比例关系,进而确立不同类型所需分配的推荐数量,并经过筛选与排序原则进行精化推荐,以满足用户对于个性化与智能化需求[5]。

3.结语

本文立足社会实际需求,提出一套智能影视作品推荐系统的构成方案。该推荐系统扎根于个性化数据挖掘中,并通过利用协同信息筛选技术,帮助系统对用户进行个性化影视作品推荐具有重要积极意义。不得不说智能推荐系统确实具有其特点与优势,但是在本文中由于相关数据的缺乏与应用实验的缺失,必然不能对智能推荐系统有一个全面的认识与研究,但笔者相信随着该项系统的不断普及应用,定能得到更为长远的发展。

【参考文献】

[1]汪毅峰.基于数据挖掘的个性化推荐系统的研究与设计[D].南昌大学,2013.

[2]赵凤霞.基于数据挖掘的旅游智能推荐系统的研究和设计[J].科技创新与应用,2013(32):55-56.

[3]李中良.基于Web日志挖掘和关联规则的个性化推荐系统模型研究[D].西南大学,2014.

[4]丁建军.面向电子商务个性化推荐系统的Web数据挖掘应用研究[D].浙江理工大学,2015.

推荐系统范文篇5

关键词:大数据;电子商务;个性化推荐

当前,电子商务在各个行业领域的广泛应用,针对“基于大数据的个性化信息推荐的服务模式”也受到了学者的高度关注。电子商务类网站除了可以为用户提供商品与服务,并且也增加了消费者在大量信息中快速、精准搜索到符合其要求的产品信息难度。在大数据技术应用中个性化信息推荐功能可以随时、主动向用户推荐其所需求的商品和服务,不仅充分满足了用户对个性化消费需求,还在电子商务网站增加其消费者粘性、提升其服务品质以及市场竞争力等方面有着积极推进作用。

相关基础理论

大数据的定义。大数据,表示在新处理方法下可以使其决策能力、洞察外界环境变化能力和流程优化能力的大批量、高增长率等方面表现更佳,大数据在对大批量信息的获取以及对这些数据进行重新分配中提高其应用效率,大数据的具体分类如表1所示。大数据的特征。大数据的特征可以总结为“4V”,具体为Volume、Variety、Value、Velocity。 Volume用来解释数据规模较大,现有的数据规模级用PB来表示,而PB这一数据单位将会给其它更大的“单位”所取代,在这里面非结构化的数据会占有非常大的比例。Variety表述数据类型丰富,从阅读的题目、图片到消费历史再到网络日志等,都可以划分到大数据内容范畴之内。Value用来解释价值密度,比如视频在连续的监控中有价值的数据寥寥无几。Velocity用来解释操作效率,针对数据的操作环节这一过程非常迅速,中间的计算环节所需时间非常少,大数据和传统数据的明显区别在于:大数据可以通过传统手段对数据进行保存、分析与整理。电子商务个性化推荐服务的黎超(广东白云学院社会与公共管理学院广州510450)基金项目:2012年广东省哲学社会科学“十二五”规划项目“生命周期视角下的广东中小企业发展研究”(项目编号GD12XYJ02)中图分类号:F713文献标识码:A内容摘要:现阶段,大数据技术被广泛应用到多个行业,尤其是大数据带来的个性化推荐服务系统,在电子商务行业得到了普及并且取得了卓越成绩。本文针对大数据背景下电子商务个性化推荐服务系统实施基础工作进行了具体阐述,以期促进电子商务服务个性化与智能化的发展实践。关键词:大数据电子商务个性化推荐定义。电子商务个性化推荐系统即针对各种消费群体的不同需求为其提供针对性服务,或者电商企业主动结合消费者上网习性的异同为其提供专业的服务,为消费者创建一个高品质的购物平台。个性化内容推荐系统构建在消费者对内容的应用习惯上,满足消费者对个性化内容需求的服务。研究消费的信息应用偏好可以精确地为消费者提供信息服务,推进个性化信息内容服务业务的展开。电子商务个性化推荐服务的特征。电子商务个性化推荐服务系统是围绕消费者需求来展开的,其主要特征如下:一是服务内容针对性显著。个性化推荐服务针对性较为显著,能够满足各种消费者的不同需求,同时还可以与消费者实施信息内容交换操作,也就是消费者可以主动为信息提供方提出自身需求,同时还可以对其所接受的服务展开评分操作。上述信息内容交换模式对信息提供方不断更新以及改进其服务形式有着积极推进作用,使其所提供的服务更大程度满足消费者的个性化需求。二是服务内容多样化。客户群体还可以结合自身需要设定信息内容服务形式与信息内容获取时间,电商企业可以结合消费群体这种自定义模式为其呈现出相对应的信息内容服务。客户群体在信息内容接收模式上主要包括E-mail、音频或者视频等。除此之外,个性化信息内容服务使得消费者仅仅通过网络就可以随时随地享受个性化服务。三是服务具有主动性与时效性。个性化信息内容服务可以主动为客户群体提供服务,为客户群体实时推送最新资讯,保证为客户群体所推送的资讯有着非常强的时效性。四是服务的智能性。个性化信息内容服务具备较为显著的智能性特点,其可以根据消费群体的浏览轨迹实时刷新,为客户群体传送最新的个性化内容,并且为客户群体推送的内容都是满足客户群体消费需求的。五是电子商务个性化推荐服务的意义。对于客户群体来讲,电子商务个性化推荐可以提高消费者对所需产品的浏览效率,为消费者节省大量时间;关于内容提供对象来讲,电子商务个性化推荐系统可以保持消费者粘性和规模,利用节约时间来保证消费者的访问量,让消费者在短时间内获取更多产品内容,进而保证产品的销售业绩。随着大数据的应用,电子商务个性化推荐服务系统越来越成熟,不仅提高了电子商务类企业的市场效益,并且也丰富了其信息内容服务模式,为其服务模式有效开展提供发展平台。

主要技术应用

(一)协同过滤方法。协同过滤主要应用于识别某个既定客户可能感兴趣的商品,其分析依据主要是根据其他消费群体对这些产品的感兴趣程度。协同过滤方法可以利用对既定消费群体所感兴趣的产品进行研究来辨认某个消费者的所感兴趣的商品。在电子商务领域该方法受到了技术人员的高度认可,基于某个客户群体的同类消费群体倾向的商品来分析和预测该消费群体可能感兴趣的商品。该技术是建立在内容这一前提条件下的,其和直接分析手段有着明显区分,系统过滤技术可以在大规模的客户群体中找出和既定客户群体有着相同偏好的消费者客户,并且将这类相同客户群体对某个产品的评论进行整理并剖析,可以直接剖析出这一消费者客户的购物倾向,并且对该消费者客户关于某个产品的感兴趣程度进行精准推测。当今,越来越多的电子商务公司利用该方法来提高其销售平台的服务水平与服务质量,该方法优势与不足如表2所示。(二)客户群体建模技术。成立高质量的消费者模型对于提升个性化信息内容推荐效率有着不容忽视的作用,为了保证该模型的实用性,可以在消费者感兴趣的信息资料中提炼出相关属性,通过建模方法并对消费者倾向的产品进行管理。电子商务个性化推荐内容服务是在互联网环境中开展的,该模型和简单的描述性模型有着明显区分,其有着附带相关数据结构模式的功能。该模型的更新数据服务功能建立在消费者对产品的查找上,如此一来便可以为消费者提供定向、高效率服务。该模型的刷新主要包括两种模式:其一为直接刷新,利用消费者对系统给出的推送产品进行回馈刷新模型,对消费者购物行为产生直接影响的内容实时刷新,通常会消耗大量的时间,因此很难实施;其二为间接刷新,利用对消费者浏览方式的跟踪并挖掘Web日志数据来完成。

服务模式构建

推荐系统范文篇6

关键词:位置服务;二维码定位;协同过滤;推荐

随着“互联网+”时代的到来,创新2.0推动下的互联网信息技术思维不断改进着社会经济形态,促使创造新业态。尤其随着移动互联网、人们智能手机以及先进的GPS定位技术的使用,推动了基于位置的服务方面的发展,这在旅游产业、物流产业已逐渐衍生了较多位置数字产品,但在图书馆建设基于位置的服务还显得较为苍白。在数字经济时代,图书馆由纸质迈向了数字技术时代,实现数字藏书,尽管较多地区图书馆推出“移动图书馆”微信公众号、APP等,但对于读者的位置却显得较为局限,没有很好地利用基于位置给读者的智能推荐服务。因为对于读者而言,满足个性化图书的借阅是基本需求,但目前的现状是,读者必须借助馆内的检索机获知目标图书的馆藏地信息和中图分类号,再借助每个楼层的出入口或者馆内书架口的“楼层书库-图书类别”表,找到目标书架,从而最终找到目标书籍,整个过程过于烦琐,基本靠人工操作完成,而且大多数馆内的图书中图分类号(例如K247.57)过于抽象,更别提基于读者位置为读者智能推荐潜在偏好的图书服务。因此,实践中这个问题始终存在,如何化解,成为图书馆建设研究的重要问题。毕竟馆内,读者的不同位置可能产生差异需求,即使在同一位置,不同读者的图书服务需求也有可能是不一样的。读者快速获知目标图书的位置并基于位置被智能推荐周围图书,能满足读者的基本及潜在需求,是智慧型图书馆重要的一部分。因此,本文研究国内外关于位置服务的图书馆推荐系统情况,通过研究二维码定位技术和基于用户的协同过滤算法,分析推荐系统架构,协同过滤技术和聚类技术,促使实现基于位置服务的图书馆推荐系统,从而满足馆内读者基于位置快捷找到藏书,以及推荐读者基于位置潜在的偏好书籍,提高图书被读者借阅的概率,降低使用成本,希望有益于图书推荐系统的理论研究。

一、国内外对图书馆基于位置服务的研究现状

(一)国外相关研究。国外对图书馆基于位置服务的研究较早,始于20世纪90年代,侧重研究构建馆内导航系统。对于图书馆基于位置服务的研究,美国不仅在理论上研究丰富,并积极投建于高校图书馆中。纽曼图书馆坐落在美国东海岸弗吉尼亚理工学院,其利用校园强大的全覆盖无线WIFI,研发了纽曼系统。[1]在美国的另一州,伊利诺伊大学图书馆也致力于位置服务的推荐系统研究,JimHahn试图在推荐系统上有所突破,建立一个精准的基于位置服务的推荐系统模型,为用户提供更精细的推荐服务,该推荐系统模型确定用户所在的馆内位置是通过其连接的最近Wi-Fi接入点来判断,并根据用户所在的位置,规划路线指引用户找到目标书籍,还能实时为用户提供需求服务,根据用户的研究领域或要求,为用户推荐借阅率较高的书籍或者权威资料、数字文献等。(二)国内相关研究。国内对图书馆基于位置服务的研究较多停留在理论上,较多学者强调建立智慧型图书馆,但在实践中还缺乏普及和研发。在这些学者中,本文主要阐述以下几位学者:王佶等(2013年)认为定位服务应当广泛应用于图书馆内各项服务中,譬如读者对书目检索、书刊推荐、讲座咨询、其他服务咨询等,定位服务能节省使用成本,并提出基于WIFI展开一系列的定位推荐服务,研究分析了定位服务的基础设施建设、平台建设以及步骤算法。薛涵(2014年),同样也是基于Wi-Fi馆内定位导航技术和虚拟现实设计,以哈尔滨工程大学的图书馆为实验设计背景,实现用户与借阅图书的定位线路导航,方便读者准确找到书籍,但并对基于位置的其他推荐服务分析较少。陈国钢(2014年),探索了图书馆室内定位LBS的工作模式,同时应当将此定位模式应用于多种服务类型,不单是定位导航,并注重用户的隐私和习惯。王建功等(2014年),提出在图书馆书车上安置摄像头,将二维码设置成路标,书车拍摄扫描二维码获得准确的位置坐标和线路方法。林泽斐(2014年),则将二维码与微信公众号融合,将公众平台的接口生成具有定位功能的二维码,并贴在图书馆各书架附近,用户通过微信扫一扫功能读取所在位置,使用成本低且定位精准。综上所述,国内外对图书馆基于位置服务已有研究,在美国高校图书馆甚至已有较为先进的使用,证明了本项目研究的可操作性,而在国内智慧图书馆建设中还较多停留在理论层面上,需要进一步的讨论和实践中研发。对此,本文结合二维码定位技术及基于用户的协同过滤算法,分析推荐系统架构,利用协同过滤技术,实现基于位置服务的图书推荐系统,丰富理论研究。

二、基于位置服务的推荐技术研究

基于位置服务的图书馆推荐系统实现离不开与技术的合作,对此,本文推荐使用二维码定位技术及基于用户的协同过滤算法,并阐释关键原理,论证其合理性。(一)二维码的定位技术。通过二维码定位技术生成用户所需的定位图片,通过服务器端程序以微信指定的图文消息回复XML格式进行响应,响应的XML数据中包含地图缩略图URL及高清地图文件URL,将位置的地理数据生动地展现出来。[2]微信服务器将转发此消息响应,并显示于读者微信终端中。在满足了用户定位检索后,如若用户对馆藏资源还有进一步的检索需求,可通过指定输入相关资源的名称、作者、关键词、甚至是ISBN号等检索词,经由OPAC模糊检索,该用户确定选择后,二维码定位系统将检索得的目标书号与图书馆各书柜的分类号上下限进行前向匹配。若目标书号位于读者当前所处楼层书柜的分类号上下限区间,则在目标书柜位置覆盖定位标识图片并输出。(二)基于用户的协同过滤算法。传统的推荐算法有三种,分别是“基于内容的推荐算法”、“协同过滤推荐算法”和“混合推荐算法”。在这三种推荐算法中,被学界公认最流行以及高度实现应用地位的是“协同过滤推荐算法”。[3]基于对象的不同,可将“协同过滤推荐算法”细分为基于用户的协同过滤算法和基于物品的协同过滤算法。顾名思义,基于用户的协同过滤更多考虑用户的相似性,将用户评分高的项目智能推荐给相似的用户;基于物品的协同过滤更多考虑的是物品的相似性,根据用户的历史行为或者对物品的评分,向用户推荐相似的物品而不是推荐用户。本文使用“基于用户的协同过滤算法”。以图书馆应用举例,该算法先让目标用户通过预设的偏好书籍的问题进行评分,得出该目标用户偏好书籍的特征值,并通过数据库储存信息找到类似的用户,并根据历史类似用户评价很高的书籍对目标用户进行推荐,实现智能推荐。该项算法已较高应用于图书馆基于位置服务的推荐系统和机器学习中,有效地提高了图书馆推荐系统的性能。[4]

三、图书馆推荐系统的实现

(一)系统架构。该推荐系统分为三个模块:定位模块、爬虫模块、推荐模块。系统架构定位模块通过在WIFI环境中微信扫取楼层二维码图案返回服务器回传回来的位置地图信息;爬虫模块主要是通过在OPAC上抓取大量用户对书籍的历史评分一系列的数据进行相关解析;推荐模块通过对用户的偏好分析,并对各种推荐算法模型进行比较试验,最后通过基于聚类的协同过滤算法推荐出用户潜在喜欢的图书。(二)系统实现。首先,读者通过手机微信扫取所在楼层的二维码图案,获取自己的位置以及周围的书籍集合位置图案。然后,继续在微信搜索框里输入想要找的图书,系统会根据用户的位置和历史喜好,返回给读者目标图书的位置以及位于读者周围的潜在偏好书籍的位置。

四、结语

推荐系统范文篇7

电子商务推荐系统(RecommendationSystemsforE-Commerce)定义是:“它是利用电子商务网站向客户提供商品信息和建议,帮助用户决定应该购买什么产品,模拟销售人员帮助客户完成购买过程”。

推荐系统面对的是用户(user),任务是为用户提供对项目(item)的推荐。用户是指推荐系统的使用者,也就是电子商务活动中的客户。项目是被推荐的对象,是指电子商务活动中提供给客户选择的产品和服务,也就是最终推荐系统返回给用户的推荐内容。在一个电子商务活动中,用户数和项目数是非常多的。推荐系统面对的当前用户,称为目标用户或者活动用户。推荐系统的当前工作,就是为根据一定的算法,给出对目标用户的推荐项目。

电子商务推荐系统主要由三大部分构成:输入模块、推荐方法模块和输出模块。输入模块用来接受用户的输入信息,用户的输入信息中最重要的是用户对项目的评价(rating)数据;推荐方法模块用来根据一定算法,根据用户数据,得出对目标用户的推荐,该模块是整个推荐系统的核心部分,个性化推荐方面的研究的很大一部分,都集中在找到好的推荐方法。输出模块主要是指得到的推荐以何种形式反馈给用户。

根据项目的特点,目前主要有两种类型的推荐系统,一种是以网页为对象的个性化推荐系统,主要采用Web数据挖掘的方法与技术,为用户推荐符合其兴趣爱好的网页;另一种是网上购物环境下的、以商品为推荐对象的个性化推荐系统,为用户推荐符合其兴趣爱好的各类产品,如各种书籍,音像等,这种推荐系统也称电子商务个性化推荐系统。

二、电子商务个性化推荐系统的作用

电子商务推荐系统的最大的优点在于它能收集用户兴趣资料并根据用户兴趣偏好为用户主动作出个性化的推荐,也就是说,当用户每次输入用户名和密码登录电子商务网站后,推荐系统就会按照目标用户偏好程度的高低推荐用户最喜爱的N个产品,而且系统给出的推荐是实时更新的,也就是说当系统中的产品库和用户兴趣资料发生改变时,给出的推荐序列会自动改变,大大方便了用户,也提高了企业的服务水平。

总体说来,电子商务推荐系统的作用主要表现在以下几个方面:一方面,使用户从无限的网络资源和商品世界中解脱出来,大大节约了用户采购商品的时间和成本;与此同时,推荐系统的个性化推荐服务,提高了客户对电子商务网站的忠诚度(BuildingLoyalty),将更多的电子商务网站浏览者转变为商品的购买者,从而提高电子商务网站的交叉销售能力(Cross-Selling),为电子商务企业赢得了更多的发展机会。

研究表明,在基于电子商务的销售行业使用个性化推荐系统后,能提高销售额2%-8%,尤其在书籍、电影、CD音像、日用百货等产品相对较为低廉且商品种类繁多的行业,以及用户使用个性化推荐系统的程度高的行业,推荐系统能大大提高企业的销售额。

电子商务推荐系统和销售系统(MarketingSystems)、供应链决策支持系统(Supply-ChainDecision-SupportSystems)既相似又有不同。销售系统是帮助销售人员如何把产品销售出去;推荐系统最终目的帮助用户,辅助用户购买什么产品做出决策。供应链决策支持系统是帮助生产者决定什么时候生产多少什么产品,以及仓库应该存贮多少各类产品,其最终目的是为企业生产者服务的,而同样推荐系统是面向用户的系统。

三、电子商务个性化推荐系统的研究内容

电子商务个性化推荐的研究有四方面的问题:首先,要解决推荐系统的信息来源问题——推荐系统的基础是用户兴趣资料信息,如何在电子商务环境下尽可能获得更多用户的相关信息,并以合适的形式表示是进行个性化推荐的前提;其次,要实现被顾客接受和认可的个性化推荐,设计准确、高效率的个性化推荐算法是核心;另外,要让推荐系统为广大用户所接受,必须对推荐系统作出客观、综合的评价,尤其要注意从准确率、个性化、安全性、用户满意度等多方面进行评价;推荐系统的应用是最终研究的落脚点,推荐系统不仅能为用户提供完全个性化购物环境,更应为企业的销售决策和客户关系管理提供支持。

在电子商务环境下,用户信息收集表示是电子商务个性化推荐的基础。根据当前对电子商务环境下用户信息收集表示的研究来看,主要着眼于研究如何有效地收集能反映用户兴趣偏好的信息,以及如何通过网络数据挖掘等的方法更自动化地收集用户的隐式信息,解决用户信息收集过多的依赖于显式评价数据的问题。

个性化推荐技术是电子商务自动化推荐系统的核心问题。目前的推荐技术有协同过滤推荐(包括基于用户的和基于项目的)、基于用户人口统计信息的推荐、基于内容的推荐、基于效用的推荐、基于知识的推荐、基于规则的推荐等等。协同过滤推荐是个性化推荐中研究和应用最多的方法,广泛应用于电子商务网站、数字图书馆、网页搜索、新闻过滤等,著名的推荐系统有Tapestry、GroupLens/NetPerceptions、Ringo/Firefly等,其前提假设是存在具有相似兴趣爱好的用户群,每个用户都有与其兴趣爱好相似的邻居用户。预测用户对某一项目的偏好是根据邻居用户对该项目的偏好程度计算的,也就是说如果其邻居用户喜爱某项目,则该用户也很可能会喜爱该项目。协同过滤最大优点是不需要分析对象的特征属性,所以对推荐对象没有特殊的要求,能处理非结构化的复杂对象,如音乐、电影等。

对推荐系统总体性能的评价是推荐系统研究的重要组成部分。目前大都只是采用准确率、召回率等评判尺度对推荐算法进行评价,并没有真正意义上的、提升到对整个推荐系统进行的评价,尤其缺乏从个性化程度、持久性程度、系统的安全性以及用户接受程度等多方面对推荐系统进行综合的评价。

四、研究现状

推荐行为产品或其它项目的软件已经在许多应用中使用在电子商务领域,为了增加购买经验并满足客户需求,已经推出了充分利用消费者的访问和购买行为的推荐系统。推荐者通常通过给用户展示他们可能感兴趣的产品或服务来促进购买。例如,诸如就是通过利用偏好或其他用户购买信息来介绍书籍或者其它产品给用户的推荐系统。然而,使用的技术相当简单,而且并非很精确和有效。基本上,程序将当前客户购买的一系列产品与其他客户购买的一系列产品作比较,选择客户购买较多的产品与当前客户购买的产品集合的交集,最后从中选出一些尚未被客户所购买而仍然在顾客购物篮中的产品,并将它们作为推荐列表呈现给客户。该技术也用于类似于协作过滤的文本文档的信息抽取。电影或音乐唱片的推荐,例如,通过预知一个人的偏好与其他人偏好的线性权重集合,并运用协作过滤技术来实现。

对于推荐系统的研究可分为三个种类:技术系统开发研究,用户行为研究和隐私问题研究。其中技术系统开发是重点。目前各种推荐技术,例如数据挖掘,和推理,都已经应用到了推荐系统中。现存的推荐系统从广义上可以划分为基于规则的系统和信息过滤系统。信息过滤系统又可分为基于内容过滤的系统和协作过滤系统两种。

基于规则的系统,N1如:IBM的WebSphere,BroadVi-sion,ILOG等。他们允许系统管理员根据用户的静态特征和和动态属性来制定规则,一个规则本质上是一个if-then语句,规则决定了在不同的情况下提供不同的服务。基于规则的系统,其优点是简单、直接,缺点是规则质量很难保证,而且不能动态更新。此外,随着规则的数量增多,系统将变得越来越难以管理。

基于内容过滤的系统,例如:PersonalWebWather,SysKill&Webert,Letizia,CiteSeer,ifWeb,SIFTER,PVA,WebMate,WebACE,ELFI和WebPersonalizer等。他们利用资源与用户兴趣的相似性来过滤信息。基于内容的推荐系统通过将顾客的偏好与产品内容自动匹配来给顾客提供建议,例如网页和消息条目的推荐。在基于内容的系统中,产品由其普通属性描述。顾客偏好通过分析产品比率以及相应的产品属性来预测。基于内容过滤的系统,其优点是简单、有效。缺点是难以区分资源内容的品质和风格,而且不能为用户发现新的感兴趣的资源,只能发现和用户已有兴趣相似的资源。在基于内容的推荐系统中,一个核心问题是识别关键属性集合。如果该集合太小,显然,这对于识别用户剖面是不充分的。因此,基于内容的推荐系统不能用于仅仅实施一次购买行为新顾客,或者访问了该网站,却没有实施任何购买行为的潜在顾客,以及购买他不是特别经常购买的一种产品的顾客。

协作过滤系统如:WebWather,Let'sBrowse,Tapestry,GroupLens,Fab,Alexa,Firefly,SELECT,LikeMinds和Site-Seer等。他们利用用户之间的相似性来过滤信息。协作性的推荐系统估计顾客对特定产品的偏好是根据顾客对该产品的偏好率以及其他顾客对同一产品的偏好率的比较来实现的。协作性的推荐系统与基于内容的推荐系统之间的主要区别是协作性的推荐系统通过跟踪一组顾客过去的行为来给该组中的个别顾客提供建议。使用该方法,顾客现在就可以接受建议,而在基于内容的推荐系统中,只要具有相似意向的其他顾客的偏好,顾客就己经具有先前预测了。基于协作过滤系统的优点是能为用Web数据挖掘的研究及其在网络学习个性化推荐中的应用户发现的新的感兴趣的信息,缺点是存在两个很难解决的问题,一个是稀疏性,亦即在系统使用初期,由于系统资源还未获得足够多的评价,系统很难利用这些评价来发现相似的用户;另一个是可扩展性,亦即随着系统用户和资源的增多,系统的性能会越来越低。协作性的过滤方法用来识别与既定客户具有相似兴趣的顾客,所推荐的产品也是这些给定客户喜欢的产品。该方法的一个主要局限是稀疏问题。在基于协作过滤的推荐系统中,很难精确确定下相似客户和识别要推荐的产品。不仅如此,系数问题的极端形式是first-rater问题,当市场引入一种新产品时,不存在可用的先前估计信息。

还有一些个性化服务系统如:WebSIFT,FAB,Anatagon-omy和DynamicProfiler等,同时采用了基于内容过滤和协作过滤这两种技术。结合这两种过滤技术可以克服各自的一些缺点,为了克服协作过滤的稀疏性问题,可以利用用户浏览过的资源内容预期用户对其他资源的评价,这样可以增加资源评价的密度,利用这些评价再进行协作过滤,从而提高协作过滤的性能。

近来,许多因特网公司还引进了有关信息产品的推荐系统,它包括Web站点推荐,音乐推荐,视频推荐,书籍推荐等等(例如,以及等等)。因特网行销机构运用推荐系统对某一广告公司推荐用户(例如Ac-tiveAgentWerbenetz。

通过将书籍推荐给已经购买过特定书籍的顾客实现个性化推荐的。.所推荐书籍概括的分为有两种:小说书籍和非小说书籍。小说书籍的推荐很简单,就是将同一作者的其它小说书籍推荐给特定用户,这样最终就将由该作者撰写的相似类别的小说书籍推荐给了有相似背景的用户。而非小说书籍的推荐将是将每个作者的相似类别的小说书籍推荐给了有相似背景的用户。

五、电子商务推荐技术存在的问题和发展方向

综合目前电子商务中个性化推荐系统的现状可以看出,现存的个性化推荐系统技术大都是基于规则的系统,基于内容过滤的系统,以及协作过滤系统三种。而且,这些个性化推荐系统所运用的技术也仅仅限于基于内容的过滤,KNN(L-NearestNeighboring)技术,基于聚类的(Clustering-based)协作过滤,基于项目的(Item-based)协作过滤,序列模式,规则分析等等。由于这些推荐系统各自应用范围的局限,而且都不同程度的需要人工参与,因而导致目前推荐系统的推荐精确度较低。不仅如此,大多数个性化推荐系统只是给用户推荐一些不同类别的资源,这与普通的搜索引擎比较相似,而且对用户正确行为的推荐却比较少。

未来电子商务推荐技术研究的发展主要体现在以下几个方面:

1.组合推荐技术的研究

众所周知,现存的推荐技术已经得到推广和应用,但各种技术都存在一些缺陷,能否将各种推荐技术融合起来作到取长补短是未来电子商务推荐技术研究的重要课题。

2.推荐技术准确度的研究

目前的推荐技术推荐的准确性还得不到保证,准确度的研究还局限在手工实验阶段,因此,研究出自动的准确性验证理论模型就显得非常重要。

3.数据获取方面,主要还是依赖用户的显式评价,在自动获得用户的隐式信息方面做得不够。

4.研究过于集中解决推荐算法性能的提高,对推荐系统的开发与应用,尤其是与企业其它系统的集成应用,在辅助企业的市场销售,客户管理和企业商务智能方面缺乏研究。

参考文献:

[1]CooleyR,MobasherB,SrivastavaJ.Dataprepara2tionforminingworldwideWebbrowsingpatterns.JournalofKnowledgeandInformationSystems,1999(1):230~241

[2]GoldbergD,NicholsD,OkiBM,TerryD.Usingcol-muni-cationsoftheACM,1992,35(12):61~70.

[3]ResnickandVarian.RecommendationsystemsCommu-nicationsoftheACM,40(3):56C58,1997.98-122

[4]R.D.Lawrence,G.S.Almasi,V.Kotlyar,M.S.Viveros,S.S.Duri,Personalizationofsupermarketproductrecommenda-tions,IBMResearchRport,2000.43-75.

[5]邓爱林,朱扬勇,施伯乐.基于项目评分预测的协同过滤推荐算法[J].软件学报,2003,(9).

[6]曾春,邢春晓,周立柱.个性化服务技术综述[J].软件学报,2002,(10).

[7]赵亮,胡乃静,张守志.个性化推荐算法设计[J].计算机研究与发展,2002,(8).

推荐系统范文篇8

【关键词】电影推荐;数据挖掘;机器学习

1前言

随着现代科技生产力的发展,人们在空闲时间中逐渐开始追求更高要求的娱乐活动,而电影就是最为普遍的娱乐方式之一。不管是喜剧还是悲剧,都能勾起你纯真的眼泪;不管是动作片还是恐怖片,都能让你的肾上腺大开大合;不管是科幻片还是纪录片,都能让你云游古今中外。不管是去电影院,或是购买影碟,或是在网上观赏影片前,人们总是有选择性地去寻找一些更符合自己喜好的、内容精致的、更受欢迎的电影去观看。但是,如今影片的拍摄逐渐走向高产化,佳片许多,烂片也层出不穷,如果采用人工方法,在大量电影影片中找到自己真正喜欢的电影是一个耗费精力的事情。本文通过大数据挖掘技术构建了一个智能的电影推荐系统,针对不同用户,提供多个与其过去的观影信息相似度较高的符合该用户喜好的电影,满足用户的观影需求。本文使用了kaggle网站中TMDB5000MovieDataset的电影数据集,主要结合应用分类统计(ClassStatistics)、样本相似度(Correlation)分析等经典数据挖掘算法,剖析数据间的关系,从而完成电影推荐系统的相关功能。用户为系统提供一个电影的名称,该系统提供与这部电影在类型、内容、受欢迎程度、年代等综合程度最相似的五部影片。

2数据预处理

本文所使用的电影数据集,包含:电影类型(genres)、关键字(keywords)、导演(director)、演员(actor)、发行公司(compa-ny)、电影评分(IMDB)、成本(budget)、评分人数(count)、电影的发行年份(year)、发行国(country)、语言(language)等字段,共计5000多部电影详细信息。本文的智能推荐系统主要依赖电影和电影之间的“相似度”(similarity)来为用户推荐电影,在计算相似度的过程中会使用描述该电影的“关键字”(keywords)作为计算的主要因素之一。但是在这些关键字中有大量的低频词,会对计算过程产生噪音影响;关键词中还有大量的同义词,如“shadow”和“dark”,同根词,如“music”和“musical”、“train”和“training”、“apple”和“apples”,在计算相似度应该被视为同一个词。因此,我们使用以下的预处理方法对关键字进行了清洗。①本文应用python的NLTKpackage合并了同义词和同根词。②本文对频次小于五次或出现在少于三个电影的关键字进行了过滤。数据集中有一些属性需要进行离散化处理,如发行年份(releasedate),本文应用了EXCEL的YEAR()函数和ROUND-DOWN()函数以10年为间隔,将其分为了1930s、1940s一直到2010s(代表2010年及以后)的年代制。

3电影推荐系统的设计

不同的人在挑选电影的时候往往有不同的选择,但是大抵都会考虑以下几个方面。电影的导演和演员以及制作公司可能是观众会着重考虑的部分。著名导演例如姜文、JamesCameron,作品虽少但精品居多,他们的电影上映后可能会吸引大量观众。演员也是电影的一个重要载体,如RobertDowney这样拥有优秀的演技、帅气外表的演员收揽了众多的狂热粉丝,带来了票房大卖。电影公司也在观众的选择中有着重要的影响,像MarvelStudios、DCEntertainment这类公司靠超级英雄系列吸引了许多观众,该系列的每一部新片上映都会快速引起观影热潮。我们称这部分因素为创作(cast)因素。电影内容、电影类型、发型年份、语言在不同程度上也是影响观众选择电影时的因素之一,观众会优先去看符合自己口味的电影。换句话说,一个喜欢看动作片的人,会在众多电影中选择如敢死队、警察故事这类以动作取胜的影片;而一个人若喜欢爱情片,泰坦尼克号这样唯美的作品将成为其首选。我们称这部分属性为内容(content)因素。影片在同档期中的受欢迎程度、电影评分、评分人数也是决定观众是否选择这个电影的原因之一。我们称这部分因素为口碑(popularity)因素。为了探究这些因素对于观众在选择电影时的影响,本文首先对某几个因素进行了定量分析。3.1电影类型。数据集中一部影片可能为多种电影类型,本文统计了不同类型电影的受欢迎程度。首先,使用EXCEL的计数功能,统计不同电影类型的样本数量。统计结果显式,本数据集中主要的电影类型有剧情片(drama)(2297部)、喜剧片(comedy)(1722部)、惊悚片(thriller)(1274部)、动作片(action)(1154部)、爱情片(romance)(894部),除此之外还有冒险片(adven-ture)(790部)、科幻片(sciencefiction)(506部)、动画片(ani-mation)(234部)等等。然后,本文又使用了EXCEL的“分类汇总”功能,将电影类型作为“分类字段”,将“电影评分”作为“汇总方式”,使用“平均值”作为汇总项。根据统计结果,受欢迎程度最高的三类影片是冒险片、动画片、科幻片;然而,数量最多的影片类型———剧情片、喜剧片、惊悚片并不是最受欢迎的;反观,虽然奇幻片(fantasy)、推理片(mystery)等类电影的数量并不占优势,但其受欢迎程度依然较高。因此,在电影市场中,并不是出现频率越高的电影类型,就越受大众喜爱。3.2电影年代和电影成本。本文使用同3.1相似的统计方法,依据数据集,生成了从1930~2017年不同年代电影的平均预算以及受欢迎程度的折线图,如图1所示。根据图1可知,电影成本与受欢迎程度在21世纪前并没有太大的关联性,而到了21世纪后便出现相当明显的正相关单,布景、道具也并不复杂,更多是以剧情表演展现其魅力。因此,影片投资金额并不会成为影响电影观感的重要影响因素。加上20世纪战争偏多,尤其40年代二战过后全球经济整体倒退,娱乐方面的投资相对也低很多,所以成本都偏低。纵观21世纪,随着计算机技术的蓬勃发展,观众也更爱看满屏特效的大片,这类电影的受欢迎程度自然上升且远超过去的作品。但特效的制作都需要许多的资金,换句话说,投入的资金越多,特效的制作便越真实、酷炫,影片的观影体验越好,受欢迎程度也会随之增长。于是成本便和受欢迎程度不可割舍了,也说明了成本在不同年代也体现了不同的价值。3.3电影推荐系统的设计。电影类型是影响观众选择电影的一个重要的因素,同一个观众往往会对某种类型的电影情有独钟。电影市场中有大量的动作片、惊悚片、爱情片,会因为制作的精良程度、剧情的饱满程度等出现口碑的两极化。因此,电影本身的内容也是电影制作人不能忽视的一个方面此外,希望票房大卖的电影制作人可以更多的考虑拍摄冒险片、动作片、科幻片这几种类型的影片。随着电影技术的发展,观众越来越倾向于有高额投资的影片。电影成本在21世纪后成为电影制作过程中不可分割的一个部分,直接决定着电影的制作效果、演员的选择等重要方面,也因此成为影响电影受欢迎程度的重要原因之一。本文在设计电影推荐系统的过程中,要着重考虑创作(cast)、内容(content)和口碑(popularity)三部分因素对电影的影响。我们将电影推荐系统模型的推荐过程拆分成两个步骤:第一步,通过电影与电影之间在创作和内容上的相似度筛选出与用户所选电影最相似的30部电影;第二步,根据电影的口碑以及发行年份,在第一步所选的30部电影中选出5个综合评价最高的电影成为最终推荐给用户的电影。

4电影推荐系统的实现

设计推荐模型时,本文充分考虑了电影的创作、内容和口碑这三类因素。下面我们将具体阐述如何实现电影推荐系统。4.1相似度(similarity)本文所提出的电影推荐系统,在筛选与用户所选电影最相近的30个电影时,需要充分考虑两部电影之间的相似度(similarity)。根据电影的创作和内容类属性,本文将电影是否拥有相同的导演、演员、制作公司、关键字作为主要的评测指标,构建表1所示的相似度距离矩阵(distancematrix)。构建过程如下:(1)用户给推荐系统提供一个自己喜欢的电影j,取出电影j的导演、三位最重要的演员、电影所属的各个电影类型、各个预处理后的关键字。(2)计算电影数据库中的每个电影和电影j的距离值,取距离值最小的前30个电影。在计算推荐候选电影i和用户所选电影j的距离值dij时,首先我们根据i和j是否有相同的导演、演员、制作公司、电影类型、关键字,得到各个a的值。举例:如果i和j的导演相同,那ai1值为1,否则ai1值值为0;同理其他属性的距离值ai2,ai3,...,aik也是这么求得。然后使用欧几里得距离公式计算dij,公式如下:dij=kn=1Σ(ain-ajn)2,姨ajn=1(1)4.2电影的综合质量(Quantity)在得到于创作和内容上与用户所选电影j最相似的Top30个电影之后,我们认为评判一个电影是否能带给用户最好的享受,更取决于电影自身的优秀程度。在本文中,我们使用电影评分(IMDB)和打分人数(count),以及发行年代(year)作为综合质量(Quantity)来表示进一步筛选电影,缩小范围。首先,电影评分IMDB作为最具官方性的评分,其所占比例自然最大,我们函数中给予的影响也应最多,COUNT所表示的打分次数影响次之。最后,发行年代在不同时期有着不同价值,本文将利用高斯函数公式(3)来进行处理,用YEAR表示这部分值。Quantity=IMDB2•COUNT•YEAR(2)YEAR=exp-(x-c)22σ222(3)其中,σ1=20,c为所选电影j的发行年份。从第一步中得到的30个电影中,找出Quantity得分最大的5个电影,然后作为最终推荐给用户的电影。

5总结

本文通过大数据挖掘技术构建了一个智能的电影推荐系统,针对不同用户,通过相似度筛选内容上更相近的电影,并计算综合质量得分筛选质量更好的电影两个步骤的筛选,最终选出符合该用户喜好的电影。

参考文献

[1]许海玲,吴潇,李晓东,等.互联网推荐系统比较研究[J].软件学报,2009,20(2):350~362.

[2]刘建国,周涛,郭强,等.个性化推荐系统评价方法综述[D].2009.

推荐系统范文篇9

[关键词]电子商务;推荐系统;协作过滤;个性化推荐

随着互联网的普及和电子商务的发展,商品推荐系统逐渐成为电子商务IT技术的一个重要研究内容,越来越多地得到研究者的关注。目前,几乎所有大型的电子商务系统,如Amazon、CDNOW、eBay、当当网上书店等,都不同程度地使用了各种形式的推荐系统。

而且现在电子商务系统规模的进一步扩大,用户数目和项目数据急剧增加,迫切需要相应信息检索技术产生。商品个性化推荐技术,尤其是协同过滤技术,构成了现有电子商务个性化推荐系统的基础。在这里,之所以强调个性化,是因为需要推荐系统能为每个用户推荐适合他们偏好和兴趣的产品,而不是千篇一律的推荐。

一、电子商务推荐系统及构成

电子商务推荐系统(RecommendationSystemsforE-Commerce)定义是:“它是利用电子商务网站向客户提供商品信息和建议,帮助用户决定应该购买什么产品,模拟销售人员帮助客户完成购买过程”。

推荐系统面对的是用户(user),任务是为用户提供对项目(item)的推荐。用户是指推荐系统的使用者,也就是电子商务活动中的客户。项目是被推荐的对象,是指电子商务活动中提供给客户选择的产品和服务,也就是最终推荐系统返回给用户的推荐内容。在一个电子商务活动中,用户数和项目数是非常多的。推荐系统面对的当前用户,称为目标用户或者活动用户。推荐系统的当前工作,就是为根据一定的算法,给出对目标用户的推荐项目。

电子商务推荐系统主要由三大部分构成:输入模块、推荐方法模块和输出模块。输入模块用来接受用户的输入信息,用户的输入信息中最重要的是用户对项目的评价(rating)数据;推荐方法模块用来根据一定算法,根据用户数据,得出对目标用户的推荐,该模块是整个推荐系统的核心部分,个性化推荐方面的研究的很大一部分,都集中在找到好的推荐方法。输出模块主要是指得到的推荐以何种形式反馈给用户。

根据项目的特点,目前主要有两种类型的推荐系统,一种是以网页为对象的个性化推荐系统,主要采用Web数据挖掘的方法与技术,为用户推荐符合其兴趣爱好的网页;另一种是网上购物环境下的、以商品为推荐对象的个性化推荐系统,为用户推荐符合其兴趣爱好的各类产品,如各种书籍,音像等,这种推荐系统也称电子商务个性化推荐系统。

二、电子商务个性化推荐系统的作用

电子商务推荐系统的最大的优点在于它能收集用户兴趣资料并根据用户兴趣偏好为用户主动作出个性化的推荐,也就是说,当用户每次输入用户名和密码登录电子商务网站后,推荐系统就会按照目标用户偏好程度的高低推荐用户最喜爱的N个产品,而且系统给出的推荐是实时更新的,也就是说当系统中的产品库和用户兴趣资料发生改变时,给出的推荐序列会自动改变,大大方便了用户,也提高了企业的服务水平。

总体说来,电子商务推荐系统的作用主要表现在以下几个方面:一方面,使用户从无限的网络资源和商品世界中解脱出来,大大节约了用户采购商品的时间和成本;与此同时,推荐系统的个性化推荐服务,提高了客户对电子商务网站的忠诚度(BuildingLoyalty),将更多的电子商务网站浏览者转变为商品的购买者,从而提高电子商务网站的交叉销售能力(Cross-Selling),为电子商务企业赢得了更多的发展机会。

研究表明,在基于电子商务的销售行业使用个性化推荐系统后,能提高销售额2%-8%,尤其在书籍、电影、CD音像、日用百货等产品相对较为低廉且商品种类繁多的行业,以及用户使用个性化推荐系统的程度高的行业,推荐系统能大大提高企业的销售额。

电子商务推荐系统和销售系统(MarketingSystems)、供应链决策支持系统(Supply-ChainDecision-SupportSystems)既相似又有不同。销售系统是帮助销售人员如何把产品销售出去;推荐系统最终目的帮助用户,辅助用户购买什么产品做出决策。供应链决策支持系统是帮助生产者决定什么时候生产多少什么产品,以及仓库应该存贮多少各类产品,其最终目的是为企业生产者服务的,而同样推荐系统是面向用户的系统。

三、电子商务个性化推荐系统的研究内容

电子商务个性化推荐的研究有四方面的问题:首先,要解决推荐系统的信息来源问题——推荐系统的基础是用户兴趣资料信息,如何在电子商务环境下尽可能获得更多用户的相关信息,并以合适的形式表示是进行个性化推荐的前提;其次,要实现被顾客接受和认可的个性化推荐,设计准确、高效率的个性化推荐算法是核心;另外,要让推荐系统为广大用户所接受,必须对推荐系统作出客观、综合的评价,尤其要注意从准确率、个性化、安全性、用户满意度等多方面进行评价;推荐系统的应用是最终研究的落脚点,推荐系统不仅能为用户提供完全个性化购物环境,更应为企业的销售决策和客户关系管理提供支持。

在电子商务环境下,用户信息收集表示是电子商务个性化推荐的基础。根据当前对电子商务环境下用户信息收集表示的研究来看,主要着眼于研究如何有效地收集能反映用户兴趣偏好的信息,以及如何通过网络数据挖掘等的方法更自动化地收集用户的隐式信息,解决用户信息收集过多的依赖于显式评价数据的问题。

个性化推荐技术是电子商务自动化推荐系统的核心问题。目前的推荐技术有协同过滤推荐(包括基于用户的和基于项目的)、基于用户人口统计信息的推荐、基于内容的推荐、基于效用的推荐、基于知识的推荐、基于规则的推荐等等。协同过滤推荐是个性化推荐中研究和应用最多的方法,广泛应用于电子商务网站、数字图书馆、网页搜索、新闻过滤等,著名的推荐系统有Tapestry、GroupLens/NetPerceptions、Ringo/Firefly等,其前提假设是存在具有相似兴趣爱好的用户群,每个用户都有与其兴趣爱好相似的邻居用户。预测用户对某一项目的偏好是根据邻居用户对该项目的偏好程度计算的,也就是说如果其邻居用户喜爱某项目,则该用户也很可能会喜爱该项目。协同过滤最大优点是不需要分析对象的特征属性,所以对推荐对象没有特殊的要求,能处理非结构化的复杂对象,如音乐、电影等。

对推荐系统总体性能的评价是推荐系统研究的重要组成部分。目前大都只是采用准确率、召回率等评判尺度对推荐算法进行评价,并没有真正意义上的、提升到对整个推荐系统进行的评价,尤其缺乏从个性化程度、持久性程度、系统的安全性以及用户接受程度等多方面对推荐系统进行综合的评价。

四、研究现状

推荐行为产品或其它项目的软件已经在许多应用中使用在电子商务领域,为了增加购买经验并满足客户需求,已经推出了充分利用消费者的访问和购买行为的推荐系统。推荐者通常通过给用户展示他们可能感兴趣的产品或服务来促进购买。例如,诸如就是通过利用偏好或其他用户购买信息来介绍书籍或者其它产品给用户的推荐系统。然而,使用的技术相当简单,而且并非很精确和有效。基本上,程序将当前客户购买的一系列产品与其他客户购买的一系列产品作比较,选择客户购买较多的产品与当前客户购买的产品集合的交集,最后从中选出一些尚未被客户所购买而仍然在顾客购物篮中的产品,并将它们作为推荐列表呈现给客户。该技术也用于类似于协作过滤的文本文档的信息抽取。电影或音乐唱片的推荐,例如,通过预知一个人的偏好与其他人偏好的线性权重集合,并运用协作过滤技术来实现中国论文联盟-对于推荐系统的研究可分为三个种类:技术系统开发研究,用户行为研究和隐私问题研究。其中技术系统开发是重点。目前各种推荐技术,例如数据挖掘,和推理,都已经应用到了推荐系统中。现存的推荐系统从广义上可以划分为基于规则的系统和信息过滤系统。信息过滤系统又可分为基于内容过滤的系统和协作过滤系统两种。

基于规则的系统,N1如:IBM的WebSphere,BroadVi-sion,ILOG等。他们允许系统管理员根据用户的静态特征和和动态属性来制定规则,一个规则本质上是一个if-then语句,规则决定了在不同的情况下提供不同的服务。基于规则的系统,其优点是简单、直接,缺点是规则质量很难保证,而且不能动态更新。此外,随着规则的数量增多,系统将变得越来越难以管理。中国论文联盟

基于内容过滤的系统,例如:PersonalWebWather,SysKill&Webert,Letizia,CiteSeer,ifWeb,SIFTER,PVA,WebMate,WebACE,ELFI和WebPersonalizer等。他们利用资源与用户兴趣的相似性来过滤信息。基于内容的推荐系统通过将顾客的偏好与产品内容自动匹配来给顾客提供建议,例如网页和消息条目的推荐。在基于内容的系统中,产品由其普通属性描述。顾客偏好通过分析产品比率以及相应的产品属性来预测。基于内容过滤的系统,其优点是简单、有效。缺点是难以区分资源内容的品质和风格,而且不能为用户发现新的感兴趣的资源,只能发现和用户已有兴趣相似的资源。在基于内容的推荐系统中,一个核心问题是识别关键属性集合。如果该集合太小,显然,这对于识别用户剖面是不充分的。因此,基于内容的推荐系统不能用于仅仅实施一次购买行为新顾客,或者访问了该网站,却没有实施任何购买行为的潜在顾客,以及购买他不是特别经常购买的一种产品的顾客。

协作过滤系统如:WebWather,Let'sBrowse,Tapestry,GroupLens,Fab,Alexa,Firefly,SELECT,LikeMinds和Site-Seer等。他们利用用户之间的相似性来过滤信息。协作性的推荐系统估计顾客对特定产品的偏好是根据顾客对该产品的偏好率以及其他顾客对同一产品的偏好率的比较来实现的。协作性的推荐系统与基于内容的推荐系统之间的主要区别是协作性的推荐系统通过跟踪一组顾客过去的行为来给该组中的个别顾客提供建议。使用该方法,顾客现在就可以接受建议,而在基于内容的推荐系统中,只要具有相似意向的其他顾客的偏好,顾客就己经具有先前预测了。基于协作过滤系统的优点是能为用Web数据挖掘的研究及其在网络学习个性化推荐中的应用户发现的新的感兴趣的信息,缺点是存在两个很难解决的问题,一个是稀疏性,亦即在系统使用初期,由于系统资源还未获得足够多的评价,系统很难利用这些评价来发现相似的用户;另一个是可扩展性,亦即随着系统用户和资源的增多,系统的性能会越来越低。协作性的过滤方法用来识别与既定客户具有相似兴趣的顾客,所推荐的产品也是这些给定客户喜欢的产品。该方法的一个主要局限是稀疏问题。在基于协作过滤的推荐系统中,很难精确确定下相似客户和识别要推荐的产品。不仅如此,系数问题的极端形式是first-rater问题,当市场引入一种新产品时,不存在可用的先前估计信息。

还有一些个性化服务系统如:WebSIFT,FAB,Anatagon-omy和DynamicProfiler等,同时采用了基于内容过滤和协作过滤这两种技术。结合这两种过滤技术可以克服各自的一些缺点,为了克服协作过滤的稀疏性问题,可以利用用户浏览过的资源内容预期用户对其他资源的评价,这样可以增加资源评价的密度,利用这些评价再进行协作过滤,从而提高协作过滤的性能。

近来,许多因特网公司还引进了有关信息产品的推荐系统,它包括Web站点推荐,音乐推荐,视频推荐,书籍推荐等等(例如,以及等等)。因特网行销机构运用推荐系统对某一广告公司推荐用户(例如Ac-tiveAgentWerbenetz。

通过将书籍推荐给已经购买过特定书籍的顾客实现个性化推荐的。.所推荐书籍概括的分为有两种:小说书籍和非小说书籍。小说书籍的推荐很简单,就是将同一作者的其它小说书籍推荐给特定用户,这样最终就将由该作者撰写的相似类别的小说书籍推荐给了有相似背景的用户。而非小说书籍的推荐将是将每个作者的相似类别的小说书籍推荐给了有相似背景的用户。

五、电子商务推荐技术存在的问题和发展方向

综合目前电子商务中个性化推荐系统的现状可以看出,现存的个性化推荐系统技术大都是基于规则的系统,基于内容过滤的系统,以及协作过滤系统三种。而且,这些个性化推荐系统所运用的技术也仅仅限于基于内容的过滤,KNN(L-NearestNeighboring)技术,基于聚类的(Clustering-based)协作过滤,基于项目的(Item-based)协作过滤,序列模式,规则分析等等。由于这些推荐系统各自应用范围的局限,而且都不同程度的需要人工参与,因而导致目前推荐系统的推荐精确度较低。不仅如此,大多数个性化推荐系统只是给用户推荐一些不同类别的资源,这与普通的搜索引擎比较相似,而且对用户正确行为的推荐却比较少。

未来电子商务推荐技术研究的发展主要体现在以下几个方面:

1.组合推荐技术的研究

众所周知,现存的推荐技术已经得到推广和应用,但各种技术都存在一些缺陷,能否将各种推荐技术融合起来作到取长补短是未来电子商务推荐技术研究的重要课题。

2.推荐技术准确度的研究

目前的推荐技术推荐的准确性还得不到保证,准确度的研究还局限在手工实验阶段,因此,研究出自动的准确性验证理论模型就显得非常重要。

3.数据获取方面,主要还是依赖用户的显式评价,在自动获得用户的隐式信息方面做得不够。

4.研究过于集中解决推荐算法性能的提高,对推荐系统的开发与应用,尤其是与企业其它系统的集成应用,在辅助企业的市场销售,客户管理和企业商务智能方面缺乏研究。

参考文献:

[1]CooleyR,MobasherB,SrivastavaJ.Dataprepara2tionforminingworldwideWebbrowsingpatterns.JournalofKnowledgeandInformationSystems,1999(1):230~241

[2]GoldbergD,NicholsD,OkiBM,TerryD.Usingcol-muni-cationsoftheACM,1992,35(12):61~70.

[3]ResnickandVarian.RecommendationsystemsCommu-nicationsoftheACM,40(3):56C58,1997.98-122

[4]R.D.Lawrence,G.S.Almasi,V.Kotlyar,M.S.Viveros,S.S.Duri,Personalizationofsupermarketproductrecommenda-tions,IBMResearchRport,2000.43-75.

[5]邓爱林,朱扬勇,施伯乐.基于项目评分预测的协同过滤推荐算法[J].软件学报,2003,(9).

推荐系统范文篇10

关键词:用户行为;协同过滤;智能推荐

一、引言

随着数字档案室建设项目的推进,以电子文件为对象,基于OCR识别、语音识别、数据挖掘、机器学习等技术实现的电子档案管理模式正在逐步取代传统纸质档案管理模式。在电子档案管理模式下,档案信息量爆炸式增加导致信息量过载和人们需求量的严重不平衡[1]529。用户要从海量电子档案中检索自己需要的档案信息变得越来越困难了。传统的搜索引擎可以通过用户输入的关键字返回与输入关键字相关的档案信息,在一定程度上缓解了档案信息过载问题,但是当用户无法精准描述档案需求的关键字时,传统搜索引擎就无能为力了。与传统的搜索引擎不同,智能推荐系统并不需要用户提供精准的用档需求,而是通过分析档案用户行为信息(档案用户行为信息是指用户在档案管理系统中进行检索、浏览、下载、打印等操作所留下的数据痕迹[2]58),采用协同过滤算法,向用户推荐能够满足他们需求的档案信息。

二、基于协同过滤算法的推荐系统

文献研究发现:学术界认定的第一个推荐系统是1992年xeroxPARC(施乐实验室)推出的Tapestry系统(垃圾邮件过滤并电子新闻推荐系统)。该系统需要事先了解和熟悉系统用户的兴趣和爱好,只能适用于系统用户数比较少的场景。1997年,明尼苏达大学的研究小组开发了Movielens系统(电影智能推荐系统),拉开了推荐系统蓬勃发展的序幕。该系统根据用户对电影的评分,预测用户可能感兴趣的电影类型、风格、演员、导演等,向用户推荐合适的电影[3]201。Netflix(美国奈飞公司)为期三年的百万美金大赛是推荐系统领域的标志性事件之一,它将推荐算法的研究推向高潮,吸引了全世界186个国家4万多位专业人士开始投身于推荐系统领域的研究,并将这项技术从学术圈真正转向商业领域。随着Amazon(美国亚马逊公司)开始在网站上根据用户的浏览购买行为对用户进行个性化推荐,并成功提升网站35%的销售额,个性化推荐系统在图书、音乐、视频、新闻、电影、购物等领域的应用越来越广泛[4]182。国内推荐算法研究起步较晚,但也取得了可喜的成果,在门户网站、电子商务等领域开展了广泛应用,比较著名的包括:今日头条新闻、淘宝、京东、豆瓣影视推荐等。推荐算法发展至今,其技术路线大致可以划分为三类:基于内容模型的推荐算法、基于协同过滤模型的推荐算法、基于混合模型的推荐算法。协同过滤模型算法是推荐系统中较为著名和常用的一种方法。它依据“人以类聚,物以群分”的聚类特点进行预测和推荐,可以将大部分看起来无交集的人或物品,通过大数据分析、数据挖掘等技术挖掘出相似的个别群体,实现根据和你有共同喜好的人给你推荐物品或者根据你喜欢的物品给你推荐相似的物品[5]1433。常用的协同过滤算法包括基于用户的协同过滤算法和基于物品的协同过滤算法。

1.基于用户的协同过滤算法

根据当前用户对物品(信息)的偏好,计算出与之有相同口味或偏好的用户群(可以使用反查表过滤掉一部分用户),比如用户A喜欢物品A、B,用户B也喜欢物品A、B,则可以认为用户A与用户B口味或偏好相似。选择用户群中与当前用户相似度最高的K个用户作为邻居,在邻居喜欢的物品(信息)中根据与用户的相似度计算出每一件物品(信息)的相似度,根据相似度推荐物品(信息)给当前用户。

2.基于物品的协同过滤算法

根据当前用户偏好的物品(信息),计算出与偏好物品(信息)相似的物品(信息)集,这里的相似度计算不是依据物品(信息)的内容属性而是依据物品(信息)在用户历史行为记录中同时出现的次数,比如物品(信息)A和物品(信息)B在同一用户历史行为记录中多次同时出现,则认为物品(信息)A和物品(信息)B的相似度高。根据相似物品(信息)集推荐相似度最高的物品(信息)给当前用户。

3.常用的相似度计算公式

协同过滤算法主要解决的问题是,当你面对海量物品或者信息不知道怎么选择时,根据大家的行为数据来帮你做选择。它的关键核心是计算用户或者物品之间的相似度,常用的相似度计算公式包括杰卡德相似系数、夹角余弦、相关系数等方法。

三、智能推荐系统实现的关键步骤

1.设计思路

设计的主要目标是对用户进行档案的推荐,即通过一定方式将用户与档案之间建立联系[6]682。当用户浏览具体档案文本时,在页面下边自动推荐基于物品相关的其他档案也就是常见的“查询了该档案的人也喜欢”功能。常用的基于物品的协同过滤算法可以解决上述问题,该算法实现的主要步骤包括:(1)根据用户使用档案系统的历史数据收集用户偏好;(2)根据档案用户的历史行为数据计算不同档案之间的相似度。注意这里的档案相似度是指两份档案在不同的查询过程中同时被查询的次数。采用上述的分析方法和思路,结合原始数据和分析目标,可以获得如图1所示的分析设计流程图。

2.数据抽取

系统会在用户使用档案系统时,自动记录访问日志,记录每个用户在系统中的操作细节,从而建立用户与档案之间的联系。其访问的数据记录见表1,其中记录了用户ID,输入关键字,浏览档案标题、浏览时长、下载标识、打印标识等多项属性。在设计中,我们抽取所有的用户访问日志记录作为原始数据集。原始数据集应尽最大量选择数据,大量的数据能够让模型更好地学习到真实场景的数据分布,不容易产生有偏的分布估计,从而降低推荐结果的随机性,提高推荐结果的准确性。

3.数据分析

通过对用户使用档案系统的行为习惯分析,我们发现用户在找到与检索关键字相关的档案时,会进行长时间浏览、下载或者打印。在设计中我们引入了下载标识、打印标识这些字段作为档案与检索关键字相关的判断标识。对于没有下载标识和打印标识但又有一定浏览时长的档案,它也有可能与检索关键字相关,为此,我们引入了平均浏览时长概念,通过计算带有下载标识或者打印标识记录的平均浏览时长,以该时长作为基线,并判断没有下载标识和打印标识的档案浏览时长是否大于基线时长,作为该档案是否与检索关键字相关的判断标识。

4.数据预处理

由于用户访问日志记录了用户在档案收集、管理、利用等过程中的所有操作行为,其中有许多无法直接利用的“脏数据”,因而无法直接对抽取的原始数据集进行分析。因此,需要对原始数据集进行清洗:(1)删除不是用户在查询模块产生的所有日志数据;(2)删除没有下载标识和打印标识且浏览时长小于平均浏览时长的所有操作日志;(3)删除含有异常值或缺失值的日志数据,如不包含检索关键字、档案号、打印、下载、浏览标识等的日志数据。对处理后的数据,需要进行属性规约,提取模型需要的数据特征,在设计中需要考虑将用户在同一登录时段的所有档案查询记录合并为一次历史查询,因此提取“用户ID”“用户登录系统的时间”“档案文件的档案号”作为系统输入数据集使用的数据特征,数据格式如表2所示。

5.模型构建

根据输入数据集构建用户对档案的评分矩阵,用户对档案的浏览时长、打印、下载等行为对应不同的评分,其中打印、下载的评分值应高于浏览时长,表示被打印或下载的档案与检索关键字密切相关。设计中构建评分矩阵时将同一用户ID在不同登陆时段的操作分为不同的用户记录。评分矩阵如表3所示。设计采用杰卡德相似系数(Jaccardsimilaritycoeffi-cient)计算不同档案之间的相似度用以构建档案同现矩阵,其计算公式如图2。其中,分母A1∪AM表示浏览过档案1或者浏览过档案M的用户总数,分子A1∩AM表示同时浏览过档案1和档案M的用户总数。完成各个档案之间相似度的计算后,得到一个档案之间的同现矩阵。同现矩阵如表4所示。通过用户对档案的评分矩阵和档案同现矩阵可以计算出用户对档案的推荐列表,根据不同的评分优先推荐评分高的档案给当前用户。

6.模型评价