搜索改变生活十篇

时间:2023-03-31 20:17:33

搜索改变生活

搜索改变生活篇1

伴随搜索的不断演进,搜索引擎已经从当初的相关链接发展到现在的智能“框”。消费者、品牌广告主、传统企业统统汇聚在这个人口处,为搜索引擎营销提供了无限可能。谁掌握了这个入口,准就领会了品牌营销的要义。

捕获消费者

早在2006年,美国《时代周刊》就曾经将“年度风云人物”的头衔颁发给“YOU(你们)”信息时代的网民。因为正是“你们”的想法和概念,改变着信息年代。在这个信息爆炸的时代,聪明的广告主也将营销的核心聚焦在人(目标消费着)身上。

今天,当消费者在做出一项购买决定之前,通常会通过搜索获取产品的相关信息――功能,价格、质量、口碑、适合什么人群等等,这些信息影响着消费者的购买决策。正是搜索引擎的发展,带动了消费者行为的这种改变。

搜索引擎发展到今天,从人机界面来看基本没有改变,只是一个简单的搜索框。但是在这个框背后,却发生了日新月异的变化。而消费者行为的改变,决定着搜索技术、广告主投放、营销策略都将随之改变。

10年前谈到搜索的时候,消费者行为仅限于搜索一些新闻、文件资料等。如今,他们通过搜索获取品牌、产品、服务等等多方面的信息,这些信息与他们的工作和生活息息相关。随着数字化的进展越来越深入,搜索引擎能够起到的作用也将会越来越大。

伴随互联网应用的普及,消费者对搜索的需求变得越来越复杂。搜索需求已经由当初的一个或几个关键词的叠加变成具有一定含义的一句话,比如“我的电脑中毒了怎么办?”等等,这些需求对搜索技术提出了更高的要求。

此外,消费者的媒体习惯正在发生改变。目前,消费者每天在互联网上的时间逐渐超过电视、报纸、广播、杂志等其他媒体,把互联网当作生活的一部分。在日益扩大的网民中,搜索用户依旧保持着80%的高渗透率。

搜索已经成为网民生活中必不可少的一部分,而就在消费者进行搜索的那一刻,他就作为目标消费者被搜索引擎所捕获,当他站在搜索引擎这个人口处,人口背后呈现出一片营销新天地。

品牌营销之关键一环

通常,市场营销的目的是提升品牌或产品、服务的知名度、美誉度、忠诚度,以达成促进短期或长期销售的任务基于消费者行为改变。信息时代的广告主发展,搜索引擎是消费者进一步了解产品的重要手段,能够很好地帮助企业提升品牌。因此,搜索引擎营销理应成为企业在整合营销过程中的重要组成部分。线上的品牌形象,代表着更有活力、更有发展的人群,因此也就意味着他们在搜索营销方面需要更多的投入。

易观国际总裁于扬指出:“数字营销尤其是搜索引擎营销,是对传统营销方式最有力的补充。从我们的分析数据来看,为了在提升品牌方面取得事半功倍的效果,大品牌客户已经开始大规模投放搜索引擎营销,投放比例也正在不断增加。大品牌客户对搜索引擎的大幅投入将加速推动搜索引擎营销在中国的持续发展。”

由于搜索引擎能够直接捕获消费者,与之进行一对一的品牌信息传递,所以品牌广告主越来越重视搜索引擎营销,并且把搜索引擎作为企业在整合营销过程中的重要组成部分,与电视、纸媒、其他互联网等媒介形成相互补充、相辅相成的关系。

今天,我们已经可以在电视、公交站牌、地铁、报纸等多种传统媒体身上发现搜索的影子,这个小小的搜索框可以帮助企业了解消费者的主动需求,从而为后续的营销方式做准备。搜索引擎将营销前消费者行为分析、找到并捕获目标消费者、对之进行行之有效的营销活动、营销后效果评测等环节串联起来,形成一个整合营销闭环,在当中起到关键的链接作用。

另外,搜索作为电子商务网站的天然人口推动了传统企业的电子商务化进程。越来越多的传统企业正在进军电子商务领域。李宁、玉兰油、优衣库、兰寇、海尔、联想、戴尔等纷纷上马,进驻电子商务网站。分析人士指出,未来传统品牌商建立独立的电子商务平台并与搜索捆绑将会成为B2C主流模式之一。

搜索 成为大入口

经过十多年发展,搜索引擎已经从当初的几条相关链接,发展到现在的智能“框”。在这个框里,搜索引擎甚至能够满足用户“北京哪里能找到女朋友结婚”这样的搜索需求。今天,当你提出一项搜索请求时,搜索引擎呈现的或许是一个网页,或许是一个应用程序,或许是一家鲜花店的地址,或许是一个计算器,或许是一个列车时刻表。它能够直达消费者内心,展现消费者最想要的信息。从这个意义上讲,搜索引擎才是互联网真正的人口!

一方面捕获了目标消费者,另一方面链接了品牌广告主进行整合营销的关键环节,这个人口承载了消费者、品牌、广告主、媒介、应用等诸多元素,应和着消费者行为变化和广告主投放的需求。

2009年8月18日,百度CEO李彦宏描绘了搜索应用的未来蓝图:把所有用户的需求(包括消费者要找的产品信息和各种各样的应用)都集成到一个框里,用一个框来满足用户的需求。这个全新的计算平台,就是“框计算”。而框的外形,正是对人口的完美阐释,框计算所描绘的未来蓝图,包容了百度作为大人口的真正作用。

搜索改变生活篇2

搜索是网络时代需求的表达

当今社会,网络应用已经充斥着我们生活的每一个角落,引发了整个社会的变革。人们的生活离不开网络,有问题(需求)上网去寻找答案,已经成为人们的一种习惯。网络搜索成为人们获取信息和了解未知世界的主要渠道。

为了解当代消费者信息获取方式的变化,以及这些变化到底在多大程度上影响到企业的营销模式,2006年我们就此展开调查。调查围绕两个问题展开:

问题一:当你参加一个大型商务活动时,偶尔听到一个消息,看到一个广告或看到某一样东西(商品),并对此(或其中的内容)感兴趣时,下一步你会通过什么渠道、什么方式去获取进一步信息?

问题二:当你出于工作或生活需要(前提是,没有受到过任何广告等营销信息的影响,完全出于生活和工作的本能)想要了解某项业务、某项服务、某个产品或某个供货商时,你会通过什么渠道、什么方式去获取进一步信息?

调查给出的回答选项有四个:查电话(如推销员、业务员、老客户等留下的联系电话记录等);问朋友(如同行、业务伙伴、朋友等);上网搜索;找广告(设法查找曾经看过的广告或企业宣传资料)。结论显示,绝大多数人的选择都是上网去搜,而选择其他选项的人很少(如图1所示)。

与此同时,国际互联网应用咨询机构GlobalSpec在美国300多家工业企业中所做的调查也得出了几乎完全相同的结论(如表1所示)。

这表明,当今客户信息获取方式发生了很大的变化,上网搜索已经成为客户有需求时的首选方式。客户的信息获取方式变了,企业的营销传播方式就一定要跟进,在营销传播的方法和手段上有所创新。当代消费者信息获取模式的改变,是当今网络营销和搜索引擎营销流行的主要原因。

根据上述调查的结果,多数人有了需求后都会上网去搜,那么,这些搜索请求实际上就是互联网时代人们需求的一种表达方式。每天搜索引擎上有数以亿计的人次访问,这些都是出于对某种信息、知识、商品或服务需要的表达。

因此,从这个意义上来看,搜索的本身就是网络时代人们需求的表达!是市场和需求产生的源头。抓住这个源头对企业或营销来讲,至关重要。

据艾瑞咨询2009年统计:仅中国大陆2008年通过网络提交的搜索请求高达1500亿人次(这还不包括一次多词,或多次重复搜索),其中直接或间接表达目标商品或购物的需求占28.4%。国际上类似的统计,数量也是高得惊人(如表2所示)。以美国为例,据ComScore公司的统计,2008年在美国通过网络提交的搜索请求高达1370亿人次。全球仅2009年7月一个月的搜索请求就高达1130亿人次(ComScore,2009.8)。

面对如此巨大的来自消费者的需求表达,哪个企业会无动于衷?!

你要找的人也在千方百计找你

在生活中,人们经常会看到这样一种奇怪的现象:一方面很多企业抱怨现在市场和需求不足,消费者不愿意花钱,生意不好做,有了好的产品也很难寻找市场;另一方面众多的消费者(客户)在满世界寻找他们所需要的商品(产品)。真的是市场不足、缺乏需求吗?显然不是。现阶段企业真正缺乏的不是市场和需求,而是新技术环境下的市场沟通能力和网络营销执行力。

2009年我们以“高温防暴电磁阀”和“波峰焊”两个关键词为例展开分析。对于这样一些非常生僻、专业、精准,普通百姓根本不可能会主动想到的关键词(更不可能主动上网去搜),一个月内在某个占市场份额不算太大的搜索引擎上,居然有高达数百人次的搜索请求(前者284人次,后者305人次)。如果在这之中有1/3是出自于客户采购目的而搜索(寻找产品或供货商),其中蕴涵的商机惊人!

另一方面,如果客户用这两个关键词上网去搜的话,使用任何一个搜索引擎能查出的相关信息都在百万以上(还是以上述搜索引擎为例,搜索结果是前者有1,270,000条,后者有1,450,000条)。如果在这其中有1/1000是出自供货商的广告信息,那么竞争就会异常激烈。谁能先抓住客户的眼球,引发客户的关注和兴趣,谁就会决定这些需求和业务的流向!

所以,在当代网络环境下,爆炸性增长的海量信息对企业来说既是机遇,也是挑战。如果不能掌握准确的方法,企业要想在茫茫人海中找到目标客户并非易事;反之,客户要在浩浩的企业之林中,寻找到自己满意的产品或供货商也十分困难。

据我们研究,现阶段企业有了好产品而找不到市场和客户的主要原因,是没有掌握正确的营销传播方法和市场沟通手段,企业营销和客户需求之间缺乏有效沟通的桥梁。如果我们认真分析当今客户的信息获取方式以及他们在线搜索、选择和浏览行为,探索其中的规律,展开搜索引擎营销 (SEM,search engine marketing) 则大有可为。

近年来,随着网络营销知识的普及,很多企业都意识到了SEM的重要性,投入了很大的力量展开搜索引擎营销。在近几年各类网络媒体广告的投放形式中,SEM是发展最快的,可谓是一枝独秀(如图2所示)。2010年的市场规模超过百亿元(人民币)。

但是,不得不指出,尽管我国SEM市场发展速度很快,但实际的营销效果却并不太好。其主要原因是企业没有了解SEM的规律,盲目投放。

既然搜索本身就是网络时代客户需求的一种表达,那么,客户有了需求后会如何表达?用什么词语、什么工具来表达?用什么方法去搜?其中有什么规律?这些细节对企业来说都至关重要。

2007年初我们研究发现:由于消费者(客户)个体存在差异性,人们在需要某种商品时的搜索用词、表达方式和选择行为会有很大的不同。

我们选择的研究对象为汽车(购车),试验分别在清华大学经管学院的在职MBA学生和一年级大学生中展开。选择这两类人群的原因,前者是有现实需求、甚至是持币待购客户群体的典型代表,购买动机很强;后者属于普通大众中的爱车一族、企业的潜在客户,但距离购买还为时尚早。

当问及MBA学生是否有购车计划,以及购买前是否会上网搜索相关信息时(包括新车型介绍、评论/口碑、比较性能、价格等),回答百分之百是肯定的。当再问及他们分别会用什么词、什么方式去上网搜时,答案五花八门。多数人(68%)会用某个品牌且目标很明确(绝大多数都集中在:雅阁、领驭、马自达6、君悦、凯美瑞等);也有人用某种车型(如SUV、MPV、B级车等);或用某个价格或排量区间(如15到25万之间,排量2.4升以下、1.8T、2.0T)。值得特别指出的是,“汽车”一词很少有人使用。

而同样的问题在一年级学生中的调查结果却完全不同。他们上网搜索时,不但用词五花八门,而且表现出很强的盲目性。他们上网搜索相对使用最多的词是“汽车”,除此之外,如跑车、法拉利、保时捷、劳斯莱斯、奔驰、宝马、宾利等都有可能用来作为搜索关键词。

这种现象表明:搜索用词的本身就反映了客户的需求动机和个体偏好。不同个体特征和需求动机的人,在需求表达、搜索用词和对搜索结果页面关注度分布上都会有很大的不同。

什么因素左右消费者的选择(点击)行为?

为了进一步分析到底是什么影响了客户的选择行为,我们针对当时多数受访对象最感兴趣的“帕萨特・领驭”轿车展开深入分析。我们让两组不同的实验对象分别上网查询“领驭”轿车的相关信息(如图3所示),以观察不同客户群对关键词定位广告的反映。

为了研究各相关因素对消费者选择行为的影响,在研究中我们修改了原始搜索页面的内容,故意拉大某个搜索结果项内容和右侧关键词定位广告内容与关键词之间一致性的差距,同时变换它们的相对位置,观察两类不同人群选择(点击和浏览)行为的变化。结果发现:搜索者的个体特征、需求的目标定位和搜索动机的强弱等,都会对他们的选择(点击)行为产生很大的影响。搜索结果项(或关键词定位广告)的文字特征、营销诉求与关键词所反映出的客户个体特征和搜索动机之间的一致性(相关程度),是左右客户注意力和选择行为的关键因素,其次才是位置。

一个明显的例证是:定位在关键词“帕萨特・领驭”下的欧宝轿车广告,对MBA学生(购买目的和搜索动机强的客户群)来说,不论我们如何改变关键词的位置和内容,总会有一定的点击率(CR,click rite),只不过会随定位广告内容一致性(广告短语与关键词的相关程度)的不同,点击率有较大的差异而已。一致性越好,点击率越高。位置在一定范围内变动对点击率影响不大。

而同样是定位在关键词“帕萨特・领驭”下的克莱斯勒300C轿车广告,无论我们怎么改变位置和内容都无人问津。究其缘由非常明显,搜索“帕萨特・领驭”轿车的人大多属于中级轿车的消费群体,其购车预算(计划)大多在24万以内,欧宝与他们的需求非常吻合(一致性非常好)。而克莱斯勒300C(当时市场标价大约在40万人民币左右)明显高出了他们的预算范畴 (一致性很差)。

但对另一个被试群体、一年级大学生来说(暂无购买计划、需求动机不明确的客户群),他们的关注度和选择(点击)行为表现得很散乱,具有很强的盲目性,且更容易受到与购买无关的其他因素的影响。

研究结果还发现,如果我们能适当地增强广告内容与搜索用词(关键词)之间的一致性,就可以在很大程度上改变客户屏幕关注度的分布和实际点击率。此规律在搜索动机强的客户群体中表现得很明显(如图4所示)。

上述研究表明:由于消费者个体条件的差异性,人们在面对同一种商品时的搜索用词和选择行为会有很大不同。

首先,不同个体特征的人在搜索动机和搜索用词的选择上有很大的不同,真正的客户通常目标(用词)非常具体、精准,而普通大众用词却非常宽泛,漫无边际。

其次,人们会根据个体偏好、搜索目的和购买预算来选择点击(浏览)相关的内容,而且购买(需求)目的性越强的人,其选择(点击和浏览)行为就会越精准,越有规律性。反之,就越分散,越没有规律。

再次,搜索结果页面信息与客户搜索动机(通过搜索用词来体现)之间的一致性,是左右人们选择(点击)行为的主要因素,其次才是所在的位置。

在现实生活中,消费者种类繁多,网络搜索的动机五花八门,企业对此是无法控制的,但是在进行网络营销时对关键词的选定、广告(或搜索结果显示项)的文字特征、营销诉求和与关键词之间的一致性,企业是完全可以自主控制的。只要企业在制定搜索引擎营销策略时注意到上述规律,加强广告内容的一致性,就可以吸引客户的眼球,抓住购买动机很强的客户,大幅度地提高广告被点击的可能性(如图4所示),实现“让客户主动来找你”这一企业营销的终极目的。

搜索营销策略三大铁律、八项注意

搜索改变生活篇3

这并不只是因为李彦宏的“IT界第一帅哥”头衔——他创立了全球最大的中文搜索引擎百度,进而改变了中国人的信息获取方式。“没有了搜索,那还叫网络吗?”在上海浦东机场工作的Luke无法想象这种“与世隔绝”的生活。“我喜欢追寻热点新闻,喜欢在查找信息的过程中和志趣相投的朋友们交换信息。小时候没网络,遇到不懂的问题只有问人或者看书,现在求人不如求度娘(百度的拟人名称)。”

搜索引擎刚诞生时,只有一群程序员、技术高手才会使用。而到现在,它已经不再是“阳春白雪”,开始“飞入寻常百姓家”,并且与人们的衣食住行融为一体。“有问题,百度一下”成为中国网民日常生活的真实写照,而“百度一下,你就知道”更是形象地表现了搜索引擎的无所不能。搜索引擎对人类的真正最大贡献实际上是改变了人们的生活,很多人的行为模式发生了悄然的改变。

如果说谷歌的崛起重新定义了整个互联网行业的发展方向,它对中国的影响则是通过影响百度来真正达成。1999年,当从美国硅谷辞职的李彦宏带着120万美元的风险投资和“超链分析”专利技术回国时,谷歌对中国市场还处于放任自流的状态,中国也还没有一家成规模的搜索公司。当时市场上和中文搜索最接近的服务是“3721网络实名”,其提供的服务实际上仅仅解决了国人的语言障碍——在浏览器地址栏中输入中文就可以检索到相关网站。但仅凭这项技术,2001年成立仅3年的3721就在中国互联网企业中率先宣布盈利,可见用户对中文搜索的期待。

2000年,名字源于南宋词人辛弃疾《青玉案·元夕》中名句“众里寻他千百度”的百度公司成立。从2003年起,谷歌在中国市场上的流量开始落后于百度。据中国互联网络信息中心《2011年中国搜索引擎市场研究报告》,有高达95.3%的用户在使用搜索引擎时首选百度。

搜索改变生活篇4

无论是全球互联网市场,还是中国市场,搜索都需要颠覆性的创新,颠覆过去搜索概念,坚持平台开放。

国际搜索风起云涌

5月16日,谷歌了“知识图谱”,这是一款被业界视为新一代“智能”搜索的代表。 相比传统搜索结果页,这种搜索模式下的搜索页面,并不与Google用户进行搜索的关键词直接匹配,而是提供与词汇所描述的“实体”或概念匹配的页面,显得更为智能化。

同时,微软必应搜索也悄悄地进行了改版。据说新增了一个名为Snapshot的中间栏,显示实用的任务导向内容,帮助人们预订餐厅、指路或查看电影场次等。必应最独特的新功能是一个叫做Sidebar的右边栏,用以自动显示在某个特定问题上能给你提供帮助的相关Facebook好友以及其他网友的名字。这样的改版将鼓励网络搜索变成团体活动。

5月下旬,雅虎的搜索团队也正式推出了iOS平台的浏览器Axis,以及适用于Chrome、Firefox、IE、Safari等桌面平台的浏览器插件。用雅虎搜索团队产品主管Ethan Batraski 的话来说,这个浏览器的最大优点就是将传统的搜索流程“输入问题——查看结果——进入页面”简化为“输入问题——进入页面”。在体验中,记者发现,Axis解决了一个关键问题——将搜索结果可视化,并简化了用户寻找最优结果的流程。

谷歌、微软、雅虎搜索的共同点都是让搜索变得更简洁和智能化。对此,陈沛对记者表示,搜索一定需要发生某种变革,以满足互联网信息的不断增长。在国际市场,每年都会有新的搜索理念向谷歌发起挑战;而在中国搜索市场的变革,也是迟早的事情。

国内“第三代”兴起

艾瑞统计数据显示,今年第一季度,中国搜索引擎市场规模达54.9亿元,增速较去年同期降低。从市场格局来看,百度的市场份额增长到77.6%,搜索市场集中度进一步提高。

面对百度在中国搜索市场一家独大的局面,陈沛认为,搜索需要颠覆性创新而不是微创新,要颠覆过去的搜索概念。而做到这一点的前提就是开放平台,让所有网民都有机会参与到搜索结果的挖掘。 因此,2011年10月,中搜率先推出了第三代搜索引擎平台,成为国内首个直接开放搜索后台给普通用户的知识分享型搜索。

传统的智能语义分析技术,仅通过对关键词的数学计算进行匹配分析,并以列表罗列的方式展现,已经不能满足用户的复杂需求。在搜索引擎技术抓取信息后,必须引入人类的智慧以及对不同领域专业知识的积累,将匹配出的信息进行重新整合、筛选及排序,从而构成更加符合用户需求的搜索结果页面。陈沛认为,这种强调将搜索引擎核心技术与人工智慧高度结合的模式,就是第三代搜索引擎平台的核心。

“中国的搜索会越来越专业和开放,但成功者可能寥寥无几,因为很多内容资料一直掌握在传统企业里。中搜搜索把人工智慧加入搜索技术中,是多方知识的融合。中搜第三代搜索引擎平台将通过开放的战略,与传统企业一起构筑搜索服务。”这是陈沛对第三代搜索引擎平台的希望。

记者注意到,中搜第三代搜索引擎与Google知识图谱一样,也针对相互关联的事物与背景进行编篡和整合,形成更加全面的搜索结果。

陈沛认为,随着搜索引擎市场的发展,未来人的知识会变得更重要,中搜目前的平台能让搜索结果一目了然。搜索引擎的改变要颠覆以往列表式方式,以全新的综合结果出现,集合与这个关键词相关的最精准信息,如视频、百科、图片、SNS、问答等,而这些是通过人的智慧加入开放搜索平台上而产生的全新搜索结果。

记者观察

开放是搜索的精髓

虽然2012年第一季度中国搜索引擎市场规模已经超过50亿元,但随着智能手机、平板电脑等移动智能终端的大量普及,移动搜索市场用户规模不断扩大,移动互联网时代的搜索将走向何方呢?

最近,人民搜索总经理邓亚萍称,人民搜索排名第三引发了热议,焦点是其开放性;由新华社和中国移动联手打造的搜索引擎搜索,之所以难以脱颖而出,主要受制于其体制——因为开放是互联网的核心,更是搜索的命脉。

搜索改变生活篇5

[关键词] Lucene 新闻搜索引擎 Pagerank 中文分词

一、引言

当今社会随着信息化的快速发展,信息的获取已成为人们生产生活最频繁最重要的活动之一,Internet的发展改变了传统的信息传输渠道,大量的信息甚至可在短短的几秒内就从地球的这端传到那端。

新闻信息的已历经从传统的纸质媒体到电子媒体的变革,各新闻门户网站也如雨后春笋般涌现,科技的变革往往带来生活方式的变革,人们获取新闻信息的方式也从传统的被动接受方式转变成主动搜索方式,甚至将来的交互式问答方式。在其中发挥核心作用的就是信息检索技术。目前,尽管Google等搜索引擎公司推出了新闻搜索系统,但其技术未予公布,用户也无法对其改进以使系统更加个性化,而且,各类信息提供商也经常需要提供搜索引擎来方便用户对信息的获取。因此,研究专业信息领域的搜索引擎技术有着重大的意义和巨大的市场价值。本文研究中文新闻搜索引擎的构建技术,并基于开源的Lucene[1] java软件包实现了一个原型系统。

二、系统概述

1.设计目标

本系统考虑新闻检索的特点,如时效性、权威性等特点,基于Lucence,引入网页解析技术提取网页中的新闻,利用中文分词技术对新闻内容分词,同时引入PageRank技术对评分系统进行修改,使其能够很好地满足用户需求。

2.系统框架

Web搜索引擎的建立,包含从网页文档抓取,解析,再到建立索引,搜索,是一项复杂的工作。在本研究中,新闻网页数据集选自新浪,搜狐,雅虎,中国新闻网等权威门户网站,系统不仅能实现一般的Web搜索引擎提供的关键字搜索,同时它又有别于一般的Web搜索引擎,可以满足用户对新闻搜索的特殊需求。系统先利用WebZip工具从不同的新闻网站定时抓取网页,将网页保存于本地磁盘,然后利用Htmlparser解析网页以提取其中的新闻内容,时间,网址链接,本地路径。对网址链接用PageRank技术计算其重要性;利用中文分词技术对新闻内容进行分词,再由Lucene分析器进行分析,结果提交给索引器建立索引。将索引结果和PageRank值提供给搜索器,在用户对搜索器发出请求后,返回相应的查询结果。

三、系统模块和设计

1.抓取网页

我们使用软件Webzip作为抓取网页的工具,由于待抓取的是新闻网页,我们选择了几个权威的网站(搜狐,雅虎,中国新闻网)作为我们实验数据的来源,具体步骤如下:

首先,创建一个工程,并在工程的地址栏中输入待抓网页的网站根目录如news.省略。

其次,在工程的属性中进行一系列的选择:filetype选择HTML,在linklever中选择all level表示可以抓取任意层次的网页,在pagelocation中选择within current site表示只抓取该网站的网页。

我们用Webzip总共抓取了700多兆的数据量用于实验。

2.HTML解析与中文分词

由于Lucence只支持txt等纯文本格式的索引,对于HTML这类包含标签的数据我们需要进行解析过滤后才能进行索引,我们利用开源的HTMLParser[3]对网页进行解析,提取网页中的新闻标题,时间,新闻内容和链接地址,滤掉标签等不必要的信息。我们将解析器解析出来的文本利用中文分词工具ICTCLAS[4]进行分词后传递给Lucence的索引器建立索引。

3.建立索引

先利用Lucene的分析器去掉常用词,统一大小写,替换同义词等。然后就可以对四个域进行索引,分别是”paths”,”contents”,”time”,”title”。这样搜索就可以建立在这四个域上,根据不同的搜索需求对不同的域进行搜索。比如需要查某个时间的文档,就只需要搜索”time”域。

4.建立搜索函数

在索引建好的基础上我们需要建立搜索API, Lucence的搜索机制是根据用户输入的关键词,用其分析器(这里我们先用ICTCLAS进行中文分词)分析关键词,再将分析结果传给搜索函数进行搜索,返回命中文档的集合。在本系统中我们提供了两个搜索函数:一个是Lucence搜索函数的改进版,它结合Lucence的评分规则和PageRank;另一个根据时间排序。

在搜索引擎的研究中,一个核心问题就是评分规则的确定,如何确保用户感兴趣的网页或重要的富含信息的网页得分较高,这是一个较难的工作,也是一个研究热点。较成熟的方法包括向量模型,贝叶斯网络等。Lucence采用的是向量模型,基本思想是将文档依据关键词映射到一个向量空间,根据词频和逆词频来计算文档的权重,然后计算查询向量q和文档dj的相似度,此相似度便作为查询文档的得分。由于Lucence只考虑了文档自身的内容,没有考虑文档间的关系,而文档间的引用关系往往能反应文档的重要程度;就比如经常被引用的论文往往是好论文,尽管可能它的文档内容得分不高,但因为它足够权威,我们还是要提高其得分。PageRank便基于类似的思路利用网页间的链接关系来计算网页的重要性,该技术已经应用在Google上。于是我们引入Pagerank对Lucence的评分机制进行修改,在计算向量模型时加入Pagerank的值,再进行规范化处理。

5.重要新闻的提取

之前我们所做的工作主要是给用户提供关于新闻的搜索功能。除了搜索服务,我们在网页上还要提供给用户一个新闻浏览的平台,让用户知道现在什么新闻最重要,甚至可以在将来开发个性化推荐系统。因此提取重要的新闻是一项很关键的工作。在我们的研究中,该问题的解决方法如下:

A.首先提取每条新闻的标题,利用Lucene分析器对标题去除停用词并进行分词。

B.对每个标题,我们根据向量模型比较它与其他标题的相似度,得到其分数titlescore。

C.对于新闻出自的网站按其网站的重要性对每个网站赋予不同的权值weight。

D.对于新闻的出现位置,我们认为它对评分也有影响,采用如下的公式:timescore=1-i/(2*legnth)。其中i表示该新闻在网页上所处的位置,length表示当天总的新闻数。

E.最后我们综合所有的评分因子得到如下的公式:

score=titlescore*timescore*weight*(1+0.2*title.length());

按照score从大到小输出当天的部分重要新闻。

实验表明,重特大新闻和一些关注较多的新闻都排在了前列。

6.Pagerank的计算

Pagerank是Google使用的根据网页之间的链接关系,给出网页权重的一种算法。其基本思想为:当网页A有n个链接指向其他网页时,将网页A的rank值分为n份,分别赋予这n个网页。对网页集合中的所用网页使用迭代计算的方法反复计算,直到收敛到一个不动点为止。我们采用中的算法。

四、结束语

系统采用Tomcat作为Web Server, 使用Jsp/Servlet架构,界面提供按内容相似性和时间两种排序方式,实现了中文分词,Pagerank等技术;并根据新闻搜索的特点提出了相应的算法;取得了较好的搜索效果。在将来,对于用户推荐,热点新闻识别等,亦有很多研究工作有待开展。

搜索改变生活篇6

据南方日报记者了解,目前通过微博进行的营销方式已经成为微博平台的全新尝试,也为互联网营销模式带来了更多的变化。而包括微博营销和搜索营销等在内的全新的互联网营销方式,也在悄然改变着中国网民的习惯。

微博营销互动中的传播

一家螺蛳粉小店,一个被称为“小马哥”的小伙儿,一个微博账号,这些加在一起会产生怎样的化学反应呢?答案就是,人家火了。去年7月,出版过8本小说,获得过“新概念作文大赛”一等奖,跟韩寒、郭敬明同属“萌芽系”的马中才在北京的蓟门桥开了一家螺蛳粉小店,生意不算好也不算坏。为了招揽一些广西老乡,小马哥在新浪注册了微博,没想到几个月他的小店就在网上出名了。从刚开始的几个粉丝,到后来不停被转发和关注,目前,“螺蛳粉先生”这个微博已有近5000名粉丝,小店每天的收益也有4000多元,现在还有不少人开始在他的微博上订餐,平均每天有三四十份之多。

在国外,在线零售巨头亚马逊曾在Facebook上做了一些测试,发现朋友间的推荐令亚马逊的购物转换率更高,社交图谱引发了更多的购买需求。以Facebook为代表的社交网络平台已成为企业进行社会化营销的重要场所。如Facebook就推出F-commerce模式,企业品牌可以利用Facebook用户基础,通过Facebook的社交图谱和社交组件进行营销活动,让用户可以与其在Facebook上的好友进行互动、分享和交流的社会化电子商务。

从目前来看,大多数国内的企业微博营销的方式都还比较简单,主要处于品牌曝光的阶段。因此,只有增加参与和互动,才能增加品牌在微博上的影响力,并让消费者与品牌实现深度接触,这也才算是升级版的微博营销。

搜索营销免打扰式的传播

搜索改变生活篇7

知识搜索应运而生

知识搜索服务从韩国起步,经中文互联网进一步发展壮大,这一应用模式扩展到了全球,并且有了英文的服务版本。目前包括百度、新浪、雅虎、腾讯等中国主要互联网公司都提供了知识搜索服务。以百度为例,经过两年的发展,百度知道已经成功解答1700万个问题,日访问量超过1000万人使用,超过国内外所有同类服务商,成为全球最大的互动问答社区。

知识搜索在国内的发展一日千里,主要是中国用户的习惯造就,是个应运而生、应运而长的新事物。由于中国很大部分网民都是初级网民,这部分群体通常习惯于日常生活的口语化表达,而不愿意去用几个关键字来搜索满意答案;并且一些关键字搜索结果是呈现了过多的可选答案,让人看得头晕眼花。比如,一位观看近期热门电影《加勒比海盗3》的观众很想知道“加勒比海盗播出一个小时后响起的背景音乐叫什么名字”,对于这个问题,目前看来搜索引擎恐怕爱莫能助,网民们只有在知识搜索中能得到满意答案。

对非专业人士来说,搜索引擎面临着过于宽泛这一问题。有的搜索引擎采用限制搜索框数字的形式,或者缩短搜索框来改变用户习惯,但效果并不明显。与此同时,很多用户搜索时,都带着问题、因此爱用问句,因此面对用户的搜索长串,知识搜索确实是最好的解决途径。

知识搜索代表明天的方向

最近以来,“威客”一词开始流行,而这个新词的定义就是:通过网站平台进行悬赏,从而找到解决问题的办法。而这种形式,与知识搜索非常相似。据了解更早之前,国外就有了早期悬赏平台,而美国的雅虎、Google等都有相应平台,部分网站甚至已经通过收费的方式实现赢利。当你提出一个问题,很多人帮你搜索然后给出你最准确的答案,这也是搜索引擎未来的一个重要发展方向。

最大化满足用户需求,是知识搜索最大的优势所在,也为搜索引擎带来了新的重要特色。二者互相补充,知识搜索与网页搜索的紧密结合,让所有网民的信息需求得到更好满足的同时,必然也带来更为可观的广告收益。

知识搜索引擎的代表网站主要有:

中国知网,它是目前最大的基于互联网出版的学术知识搜索引擎,数据量大,但缺点是收费,使用不太方便。

百度百科,声称全球最大开放式中文百科全书。是由网友共同编写的一部网络百科全书,知识量较大,完全免费,并且是完全开放式(谁都可以添加或修改)。

太傅知识搜索,是全球最大的中文百科知识库之一。使用方便,完全免费,不完全开放式(可以随便添加,但不可随意修改),知识准确性较高。

新浪爱问知识人,“爱问知识人”汇聚了一亿网民头脑中的所有智慧,来帮助你解决问题!如果你在网上搜索不到你要的答案或资料,那就来“爱问知识人”吧!

百度知道,总有一个人知道你问题的答案

搜搜问问,凡事搜搜看,问问就知道。“问问”是腾讯旗下网站,只要拥有QQ账号,无须注册,可以直接点右上方的登录链接登录。

雅虎知识堂,雅虎知识堂是一种新型态的网络信息交流服务,提供使用者面对日常生活、学习或专业方面的疑问,可以向其他网络使用者请教,或是回答其他使用者提问的一种服务平台。

120ask有问必答,放心医苑网的有问必答,在线解答你的问题,给所有网友提供一个解决问题、共享答案的地方。

搜索改变生活篇8

收编雅虎,Bing进阶为第二大搜索

尽管只有一周岁,但Bing已开始向搜索巨头Google发出了战书,老迈的微软再度焕发了青春,这自然得益于盟友雅虎的帮助。近日,微软的Bing正式收编雅虎搜索,目的就是挑战Google。

去年,微软战略重心从Live Search转向了专业的搜索引擎,于是Bing揭开了它神奇的面纱,丰富的背景图片令人耳目一新,受到了用户的好评。当然,大多数美国人还是把Google作为搜索首选。不过,微软的Bing渐渐地进入了他们的生活。Bing投入运营以来,由于强化了搜索的人性化,变被动为主动,成为引导需求走向消费的智能一环。这是Bing的创新突破,更是微软改变搜索版图的杀招。

据分析公司Experian Hitwise最近公布的数据显示,7月份Bing在美国的市场份额为9.86%,落后于雅虎的14.43%,而谷歌的市场份额则高达71.43%。然而,当Bing吞掉雅虎之后,这个格局就变成了24.29%对71.43%。从这个意义上讲,Google的相对优势其实是在下滑之中。而Bing凭借强劲的增长势头与战略合作,从占市场份额1/8到1/3,成功地在一年间完成了自我超越,奋起直追,剑指Google。除此之外,微软Bing市场份额的稳步提升还有一个重要原因,即拥有5亿用户的社交网站Facebook采用了Bing搜索。而且,随着微软Windows Phone 7手机操作系统的面世,Bing在移动搜索领域的市场份额将继续提升。

此外,Bing搜索的精准度和人性化也颇受好评。华尔街基金经理Edwin Perello认为,自己在印第安纳的乡间别墅Google都搜不到,但是Bing就可以。旧金山高管助理Laura Michelson也用Bing找到了女友提过的隐蔽餐厅。此外,Bing以图制胜的本领也获得了专业人士的首肯,芝加哥的摄影师Paul Callan就对Bing的丰富图片库情有独钟。Callan对记者说,他曾是一名Google用户,但是现在Bing成了他的新宠。

根据微软、雅虎去年签署的协议,雅虎将负责两家公司优质搜索广告的全球销售运营业务,而微软必应则承担为雅虎公司提供后台搜索业务。搜索、广告,微软、雅虎,分而治之,攻守平衡。Bing正式收编雅虎搜索后,用户使用雅虎搜索时,在雅虎搜索页面的底下将显示“powered by Bing”的字样。雅虎广告和出版业务也将转移到微软AdCenter平台上。老迈的微软重新焕发了青春。

Bing将改变搜索的历史?

与此同时,Google也开始把业务重心向移动搜索的方向倾斜,鉴于移动设备突飞猛进的发展,搜索老大急于拓宽搜索边界,占领更新也更为广阔的市场。Bing的成绩单令分析师惊叹,但是从盈利模式来说,Google的95%收益来自其有偿搜索和广告业务。显然,Bing和雅虎广告都还需要努力。建设一个比Google更通灵、更快、更准确的搜索引擎,无疑是一个艰巨的挑战。微软借这次与雅虎的合作重整旗鼓,使得Bing已经可以跟Google抗衡,但Bing的可持续发展能力仍需要考察。

说到底,搜索引擎是一个系统而非工具。因此微软需要下功夫、斥巨资构建打通搜索、广告等业务的专项系统。吸引客户选择Bing而非Google的回馈方案也在计划之中。过去的一年里,微软在线业务部门的盈亏分别为22亿美元和23.6亿美元。微软很希望吸引像Callan这样对于搜索有强烈兴趣的用户群体。它希望通过分门别类,将旅游、健康、购物、娱乐和商业融合起来。Bing的航班搜索和预测工具不但能根据不同航线计算折扣价,同时还可以为用户提供购买或等待的建议,Bing的健康搜索还可以为医院提供数据支持。

通过搜索在线完成一系列的活动,这或许是Bing未来的责任和努力的方向。用户对于频繁点击链接还是有一定的排斥心理,因此如何智能地了解用户需求并提供帮助就显得非常重要。相关性是体现搜索智能化、人性化的标志。例如你搜索“安吉丽娜・朱莉”,左端滑动条会迅速显示出她出演的一系列影片。微软在线用户部门的高级副总裁Yusuf Mehdi认为,Bing将改变搜索的历史,缩短思想和点击的距离。

Google的统治地位不断受到来自Bing的威胁,搜索老大甚至有了模仿Bing的小动作。受到刺激的Google也在今年6月更改了自己的搜索引擎界面,摒弃了单调的图案,换上了丰富的背景。像Bing那种旅游搜索引擎的开发,更不用说链接社交网络的工具和图片搜索,都被Google一一偷师。Google甚至开始采纳Bing的皮肤和背景,似乎仿照皮毛也可以留住一些游走的用户,可见竞争对手逼迫它不得不革新以顺应潮流。这不啻为搜索界的文艺复兴。

一直独孤求败的Google,在微软的逼迫下放弃了那种固步自封的态度,只是行动上还流于借力打力。很多分析师认为,Google的改变令人耳目一新,过去灰色暗淡的格调被清洗,现在的界面的确清爽精致了许多。去年,Google为了个性化搜索开发了500个精妙算法,以适应用户不断增长的搜索需求。Google高层对于微软的Office等软件也进行了研究,工程师摩拳擦掌希望可以用更加高效的方法击败微软。

Bing在Google的口中,是与其他搜索引擎并列的,因为真正的竞争不在于单打独斗,而在于群体提升,这才是支持搜索未来的力量。Bing的旅游工具使用了Farecast的技术,后者是微软2008年收购的一家公司。今年7月,Google也掏了7亿美元收购ITA软件,后者同样是提供购买机票的软件。这种比较竞争的例子不胜枚举。例如,Bing通过令人眼前一亮的图片让搜索网站的主页非常醒目。这也是年轻人钟爱Bing的原因。今年6月,Google也提供了一批可选的背景主题,以丰富老掉牙的白板框。同时跟微软一样,Google也加入了社交网站的链接。

Google官方对这种竞争表示认同,Google负责搜索产品和用户体验的副总裁Marissa Mayer坦言,Google的变脸并非应对Bing,而是在长期规划之中的调整。类似左手滑动条的设计已酝酿了两年,现在时机成熟所以推出,不存在跟微软争锋的意图。

对于那些渴望寻求蓝色超链接之外内容的用户,搜索引擎应该也必须变得更加多元化、人性化。搜索领域竞争日趋白热化,微软长年累月被Google追着打,如今奋起反击,以创新性搜索引擎开始虎口夺食。有分析师表示,无论是谁抢到搜索界亚军的位置,都是对改善搜索行业服务的贡献。

修炼更高级的搜索服务

Bing收编雅虎搜索,对于扩充实力大有裨益。近期,雅虎就在自己的网站上推出一项名为“无限浏览”的新闻功能,类似的创新将会令未来的Bing如虎添翼。据报道,这个模块将在新闻报道下面增加相关的搜索内容,如图像、视频和幻灯片等,这将使用户消费更多的内容。Bing一直在强化Push(推)的概念,这让很多搜索结果成为了主题,会激发二次搜索乃至多次搜索,不断繁衍的周边信息便会自动衍生出来,从而刺激消费。譬如,你在搜索一块羽毛球的场地,那么相关球拍、球服、培训班等相关信息、图片、YouTube视频、甚至是Twitter、Facebook上的讨论,就会自动呈现。这是一种智能的跃迁,至少对于打球的人来说,它不是只想到林丹和苏迪曼那些准新闻的热点,而是针对个性的你提供了诸多选择,更加亲民、务实。

为了推广,雅虎使用了截图加以说明。这个图像中的窗口显示在雅虎新闻栏目的文章下面,向用户提供他们感兴趣的话题的更多的信息。这个想法是向用户提供更多的内容,不需要用户进行更多的搜索。一步到位,一站式服务,说的都很轻巧,但是能够准确地解析一个搜索词背后的意义,这才是搜索进化的开端,也更加人性化。从PC搬到手机,从指尖搬到舌尖,都只是形式、途径。真正核心的部分还是它的覆盖面与呈现方式,因为一切都是要被用来消费的。知识的消费增长了用户大脑的精神储备,而物质层面的消费,则会直接催化各个产业链的升级。雅虎的这项“无线搜索”正在测试阶段,但在出厂时会被打上Power by Bing的烙印。

搜索改变生活篇9

可以说,奥巴马显然比至今不知道如何上网的麦凯恩更懂得“网”络民心,比IBM式的希拉里更有亲和力。正是搜索引擎营销等出色的互联网营销让奥巴马大放异彩。

在网络时代,搜索引擎决定你是谁,而“你是谁”很大程度决定了企业、品牌或人能否在市场竞争中胜出。

据市场分析机构 iCrossing 所进行的一项调查数据显示:至2012年,美国企业投入到搜索引擎营销的费用将是2007年的315%。从中不难看出,“搜索引擎改变企业营销模式”的论调得到了市场的认可,而这从国际国内最大的两个搜索公司——Google 和百度 Q3 财报中也可窥一斑。

在金融危机下,经济减速反而会推动搜索营销市场的增长。由于经济环境的恶劣,手头开始拮据的企业开始寻找更加有效的营销方式,按效果付费,覆盖率更广、更精准、可控制的搜索引擎,更适合中小企业进行推广。

显然,对于企业而言,如何向奥巴马学习搜索引擎营销,把握新营销时代的精髓,将是他们未来很长一段时间内的首要任务。

就在不久前,中国互联网络信息中心(CNNIC)了报告显示,截至2009年7月30日,中国网民数已达到3.38亿,网民人数稳居世界排名第一。世界人口数量第一的国家拥有网民数量世界第一—3亿网民这个数字,不仅让世界认识到中国这个古老的国家正在科技驱动下焕发出全新的活力,更让人深刻感受到互联网时代中国所潜藏的巨大商业机会:3亿网民如果是一个独立的国家,那么她的人口数量将在世界排名第四,巨大的商业购买力无庸置疑;3亿网民如果每人每天在网络购买或消费一元钱,一个月就将会诞生一个90亿的市场份额,无数新的商业服务与商业机会将催生出来。

网络应用在走向成熟的过程中,一些新的商业应用或营销工具也随之出现,这些网络商业应用一方面促使网络应用更加深化,另一方面也为企业主提供了新的营销空间——搜索引擎营销正是在这种背景下越发受到重视与应用。

最近,中国互联网协会、中国通信标准化协会联合百度的国内首个《搜索营销标准与规范》,为整个搜索引擎营销行业的发展提供了坚实的基础和有利的保障。该《搜索营销标准与规范》不仅对搜索营销(SEM)行业的专用术语给出了权威的定义描述,还对搜索营销的步骤包括从前期准备、中期评估、后期效果监测等流程进行了系统化的规范,为企业全面的认知搜索引擎营销的各个环节提供参考指南。

搜索引擎营销蒸蒸日上,作为全球最大的搜索引擎,百度有这个实力和责任去推动行业的发展,这也是搜索营销(SEM)行业从无序走向规范、从起步走向成熟的一个标志性的事件,这也将促使搜索引擎营销发展走上一个新的高度。

搜索改变生活篇10

关键词: 人工蜂群算法; 数字图像相关; 变形; 整像素位移; 动态步长; 交叉运算

中图分类号: TN919?34; TP301.6 文献标识码: A 文章编号: 1004?373X(2013)24?0070?03

Application of improved artificial bee colony algorithm in digital image correlation

YANG Song1,2, SHAO Long?tan1, JIN Feng3, SHI Peng?hui4, CHI Jian?wei5

(1. State Key Laboratory of Industrial Equipments, Dalian University of Technology, Dalian 116024, China;

2. Education Technology & Computing Center, Dalian Ocean University, Dalian 116023, China;

3. Dalian Municipal Meteorological Bureau, Dalian 116001, China; 4. College of Information Engineering, Dalian Ocean University, Dalian 116023, China;

5. College of Science, Dalian Ocean University, Dalian 116023, China)

Abstract: Aiming at the problems of slow convergence speed and easy to fall into local optimal solution, which exist in artificial bee colony algorithms, an improved artificial bee colony optimization algorithm is proposed for the pixel displacement search in digital image correlation. In the algorithm, the search step of the following bee is adjusted dynamically according to the changes of the correlation to balance the capability of global search and local search, and the scout bee employs crossover operation of genetic algorithm to generate new solution for improving the global search capacity. The experimental results show that the improved algorithm can enhance the convergence capability effectively and improve the performance of integer pixel displacement search.

Keywords: artificial bee colony algorithm; digital image correlation; deformation;pixel displacement; dynamic step; crossover operarion

数字图像相关方法(Digital Image Correlation Method,DICM),又称为数字散斑相关方法 (Digital Speckle Correlation Method,DSCM) 是现代光学测量技术的重要方法之一[1],用于实现物体表面的位移和变形的测量。数字图像相关方法在1980年由Peters,Ranson和Yamaguchi同时独立提出的。该方法不仅具有其他光学测量方法所具有的全场、非接触测量等优点外,还具有光路简单、对测量环境要求低、便于开展工程现场测量等优点[2],是一种很有应用前途的光学测量方法。

数字图像相关法研究的核心内容是相关搜索方法。早期采用逐点搜索法,这会花费大量时间,后来很多学者对其进行改进,相继提出了Newton?Rapson算法[3]、爬山法[4]、十字搜索法[5]、小波变换法[6]和神经网络法[7]等,这些算法严重依赖于初值的选取,且部分在理解和实现上比较复杂。相比之下,群智算法有诸多优点,可直接把目标函数值作为搜索信息,避免函数求导,可解决目标函数较复杂的问题。目前应用的主要有差分进化(DE)算法[8]、遗传(GA)算法[9]、粒子群(PSO)算法[10]等,这些算法无需计算梯度和二阶导数,是对图像相关搜索方法的有益补充。近年来一些新兴群智优化算法的出现,为图像相关搜索方法的研究增添了新的动力。

人工蜂群算法(Artificial Bee Colony,ABC)是由土耳其埃尔吉耶斯大学的Karaboga在2005年提出的一种基于蜜蜂群智搜索行为的随机优化算法[11]。蜂群算法采用劳动分工和协作的机制,具有控制参数少,计算简洁及易于实现等优点,既能解决连续优化问题,又能解决组合优化问题[12]。函数优化测试表明[13],人工蜂群算法比遗传算法、差分进化算法和粒子群算法具有更好的优化性能,且容易与其他算法相结合进行改进。本文提出改进人工蜂群算法(IABC),应用于数字图像相关搜索中,有效提高了整像素位移的搜索能力。

1 数字图像相关法基本原理

数字图像相关法借助物体变形前后两幅图像的局部相关性来计算得到点的位移值,即在变形前图像中以特定点[x,y]为中心取[2M+1×2M+1]个像素的区域,通过一定的搜索方法在变形后的图像上寻找同样大小子区域的中心[x*,y*],两点位移差为[u,v],见式(1)。位移量[u,v]的计算要考虑两个区域的相关度,见式(2)。

[x*=x+u, y*=y+v] (1)

[C=y=-My=Mx=-Mx=Mfx,y-fmgx*,y*-gmy=-My=Mx=-Mx=Mfx,y-fm2?y=-My=Mx=-Mx=Mgx*,y*-gm2] (2)

式中:[M]为样本区域半径;[fx,y]为图像上点[x,y]处的灰度值;[gx*,y*]为图像上点[x*,y*]处的灰度值;[fm],[gm]为对应区域的灰度均值。相关度[c]取值范围为[-1,1],当参数[u]和[v]为适当值时,两个区域的相关度达到全局最大。搜索位移值[u,v]的过程是求2个区域相关度极值的过程。要计算每个点精确的位移值,可以通过两步法:先粗定位,后细定位。即先计算出整像素位移,然后计算精确的亚像素位移。数字图像相关的搜索时间主要取决于粗定位。相关系数[c]是关于位移值[u,v]的函数,粗定位问题可以看成两个离散整数变量关于相关函数[c]的优化问题,且[u]和[v]被限定在搜索范围内。细定位可以根据相关系数的单峰性近似满足高斯分布的特点,采用相关函数曲面拟合法求极值点来计算亚像素位置[14]。

2 基本人工蜂群算法

人工蜂群算法主要模拟蜂群的智能采蜜行为,蜜蜂根据各自的分工进行不同的采蜜活动,并实现蜜源信息的共享和交流,从而找到问题的最优解。在基本人工蜂群算法中,蜜蜂主要有引领蜂、跟随蜂和侦察蜂。人工蜂群算法在求解优化问题时,蜜源位置被抽象成解空间中的点,蜜蜂采蜜的过程也就是搜寻最优解的过程。引领蜂和跟随蜂根据式(3)进行蜜源位置的更新:

[υij=xij+rijxij-xkj] (3)

式中:[k∈1,2,…,N],[j∈1,2,…,d],[k]和[j]都是随机选取的,且[k≠i],[N]表示解的个数;[rij∈][-1,1]之间的随机数,它控制[xij]邻域的生成范围。

跟随蜂通过观察引领蜂的摇摆舞来判断蜜源的收益率,并依据收益率来选择蜜源。收益率由式(4)可得:

[Pi=fυiji=1Nfυij] (4)

式中[fυi]表示蜜源[υi]的相关度。跟随蜂选择收益率大的蜜源,根据式(3)进行搜索。搜索完毕后,采用贪心选择机制,计算全局最优蜜源位置。

若连续经过limit次迭代后,某个蜜源的相关度没有得到改善,表明此蜜源已陷入局部最优,应该被放弃,与这个蜜源对应的引领蜂转换成侦察蜂,新蜜源位置由式(5)产生:

[xji=xjmin+rxjmax-xjmin] (5)

式中:[xjmax]和[xjmin]分别表示变量的最大值和最小值;[r]是[0,1]之间随机数。通过如此重复搜索,最终找到最优解。

3 基于改进人工蜂群算法的数字相关搜索

3.1 改进人工蜂群算法

跟随蜂在选中的蜜源邻域内按照式(3)进行搜索,其步长具有随机性,算法寻优速度相对较慢,易错过或陷入全局最优解。文献[15]对搜索步长做线性调整,随步长减少,进入局部最优解邻域内也很难跳出。这里将跟随蜂更新蜜源的方法做了修改,步长根据相关度函数值进行动态调整,如式(6)~式(8)所示:

[υij=xij+ωnxij-xkj] (6)

[ωn=e-an/an-1,n=0,1,…,Gmax] (7)

[an=1mi=1mfυni-fυnmax, n=0,1,2,…] (8)式中:[ωn]称为动态步长因子;[fυni]为[υi]在第[n]次迭代时对应的相关度;[fυnmax]为在第[n]次迭代时对应的最优相关度;[Gmax]为最大迭代次数。当[an]为第[n]次迭代时,引领蜂搜索后种群相关度函数的平整度因子,其值根据相关度值进行变换。

在迭代过程中,为防止[anan-1]的值变化过大,采用工程中常用的[e]作为指数,可有效降低比值变化的幅值,使得[ωn]的取值范围在区间[0,1]内。[ωn]的计算充分利用相关度函数的信息,在搜索方向上具有一定的启发性。当[an]变化较大时,[ωn]也就较大,便于大步长搜索;当[an]变化较小时,[ωn]也就较小,便于在相关度极值点附近小步长搜索,这样可以较好地平衡全局搜索和局部搜索能力,不易陷入局部极值。当迭代次数大于limit时,侦查蜂根据式(5)产生新蜜源,式(5)具有一定的随机性,这里提出将被放弃的蜜源与当前的全局最优蜜源进行交叉运算,如式(9)所示:

[υlimit=υmax×p+υlimit×1-p] (9)

式中:[υlimit]为经limit次迭代后相关度没有发生变化的蜜源;[υmax]为当前最优蜜源;[p]为遗传交叉因子。通过运用遗传交叉运算,改善算法的全局搜索能力。

3.2 改进算法的流程

(1)初始化蜜源[υii=1,2,…,N],[υi]为2维向量[ui,vi],根据式(1),式(2)计算各个蜜源的相关度;

(2)模拟蜂群行为,引领蜂根据式(3)搜索最优蜜源;

(3)根据式(4)计算各蜜源的收益率,跟随蜂选择收益率高的蜜源,计算[ωn]的值([a0]为初始时种群相关度函数的平整度因子),并利用式(6)继续搜索;

(4)采用贪心选择机制,更新全局最优蜜源;

(5)若某个蜜源经过limit次迭代后其相关度仍没有得到改善,则根据式(9)得到新的蜜源;

(6)若迭代次数达到设置的最大次数Gmax时,算法结束,否则转到步骤(2)。

4 实验结果与分析

根据文献[16]制作两幅散斑图像,且第二幅图像相对第一幅图像的位移量为(14.3,-5.2)。相关运算的参数设置为:搜索范围设定为40×40 pixel区域,相关运算模板的大小为21×21 pixel,种群个数为50(即引领蜂和跟随蜂各占总数的一半,均为25个),交叉因子为0.9。所用计算机配置为:Intel Core2 CPU(2.8 GHz),2 GB内存。由于优化算法具有随机性,为获得更为一般的规律,故采用统计学方法对随机点(123,87)进行1 000次整像素位移计算,程序采用Matlab编程实现。

分别采用遗传(GA)算法、粒子群(PSO)算法、基本人工蜂群(ABC)算法和改进人工蜂群(IABC)算法进行计算,得到收敛率随迭代次数变化的曲线,如图1所示。

由图1可知,改进算法在55代附近开始接近100%收敛,而其他算法还没达到收敛,表明在种群数相等的条件下,随着迭代次数的增加,改进人工蜂群算法具有更高的收敛率。对计算过程中的迭代时间和收敛率进行拟合,绘制出时间与收敛率的关系图,如图2所示。由图可知,当计算时间在85 s附近时,改进算法已近似100%收敛,而其他算法尚未达到,说明在相同种群数的条件下,改进算法的收敛时间更短。除此之外,还将此方法引入到高维连续函数优化应用中,取得了更为显著的优化效果。

图1 迭代次数与收敛率的关系图

图2 计算时间与收敛率关系图

5 结 语

本文针对人工蜂群优化方法收敛速度慢、易陷入局部最优解的缺点,提出了基于动态步长因子的改进人工蜂群算法。新算法通过适应度值来动态调整搜索步长,改善算法的收敛性能,并借鉴遗传算法的交叉操作,增强群体的优秀特征,加快搜索速度。通过模拟数字散斑图像对算法进行验证表明:本文算法具有较强的全局搜索能力,显著提高数字图像相关中整像素位移的搜索速度。

参考文献

[1] PETERS W H, RANSON W F. Digital imaging techniques in experimental stress analysis [J]. Optical Engineering, 1982, 21(3): 427?431.

[2] 王怀文,亢一澜,谢和平.数字散斑相关方法与应用研究进展[J].力学进展,2005,35(2):195?203.

[3] BRUCK H A, MCNEIL S R, SUTTON M A, et al. Digital image correlation using Newton? Rapshon method of partial differential correction [J]. Experimental Mechanics, 1989, 29(3): 261?267.

[4] ZHAO Wen?zhong, JIN Guan?chang. An experimental study on measurement of Poisson’s ratio with digital correlation method [J]. Journal of Applied Polymer Science, 1996, 60: 1083?1088.

[5] 芮嘉白,金观昌,徐秉业.一种新的数字散斑相关方法及其应用[J].力学学报,1994,26(5):599?607.

[6] 简龙晖,林碧森,刘宁,等.基于小波变换的新型数字散斑相关方法[J].光学技术,2003(7):216?218.

[7] PITTER M C, SEE C W, SOMEKH M G. Subpixel microscopic deformation analysis using correlation and artificial neutral networks [J]. Optics Express, 2001, 8(6): 322?327.

[8] 潘兵,谢惠民.基于差分进化的数字图像相关方法[J].光电子·激光,2007,18(1):100?103.

[9] 陈华,叶东,陈刚,等.遗传算法的数字图像相关搜索法[J].光学精密工程,2007,15(10):1633?1637.

[10] 杜亚志,王学滨.基于粒子群算法的整像素数字图像相关方法[J].计算机工程与应用,2012(6):200?204,208.

[11] KARABOGA D. An idea based on honey bee swarm for numerical optimization, TR06 [R]. UK: Computer Engineering Department, Engineering Faculty, Erciyes University, 2005.

[12] 王慧颖,刘建军,王全洲.改进的人工蜂群算法在函数优化问题中的应用[J].计算机工程与应用,2011(13):36?39.

[13] 张超群,郑建国,王翔.蜂群算法研究综述[J].计算机应用研究,2011,28(9):3201?3205,3214.

[14] 于起峰,尚洋.摄影测量学原理与应用研究[M].北京:科学出版社,2009.