云计算在电子商务中的运用

时间:2022-01-06 11:02:23

云计算在电子商务中的运用

1云计算及Hadoop

云计算技术可以借助网络获取需要的资源,以实现资源的统一管理和调度,并按需提供服务,其主要价值是实现了软硬件需求的按需扩展能力。和传统的计算方式不同,云计算中的计算任务是并行分布在大量server中的,每个server完成分配给自己的任务后,汇总的计算结果形成最后的需求。一般而言,云计算的特点主要包括[1]:(1)资源的动态分配。不同用户对云环境的资源需求是不一样的,云计算平台可以根据用户的需求动态分配相应的资源,实现资源的动态计算;一旦用户不再需要这些资源了,那么这些分配的资源就会被回收,这种动态分配和回收资源的能力使无限扩展资源成为可能。(2)资源的虚拟化。云环境的计算、存储资源等一般分布在不同的位置,虚拟化技术可以整合这些资源,使用户可以不考虑设备类型而透明地访问各种资源。(3)智能化的自动服务。用户无需了解虚拟化及各种资源分配的知识,各种需求资源服务都是自动化的,云环境会提供相应的导航服务。目前云计算主要有三种服务模式:IaaS,PaaS以及SaaS。IaaS(Infrastructureasaservice)允许用户从计算机基础设施获得计算及存储等服务,典型代表是亚马逊的弹性云。PaaS(Platformasaservice)把软件平台作为一种服务,用户可以直接使用软件平台。SaaS(Softwareasaservice)提供给用户的是基于WEB的软件,用户无需购买,可以直接使用Webservice。现在比较流行的云计算平台是Hadoop生态圈,主要包括HDFS文件系统、MapReduce计算框架以及HBase数据库[2],其中核心是MapReduce。MapReduce在执行计算任务时,首先将输入数据划分为若干份,并拷贝到所有的计算节点,每份输入数据都有若干副本,每个副本部署在一个server上。当一个副本执行Map作业时,会从输入数据中抽取部分键值对作为Map⁃per方法的参数,计算中间值被存储在内存中。每个中间值都会执行一个Reduce作业,将此server上的所有中间值排序后,整合所有键值相同的数据。最后,每一个唯一的键值都会被传递给Reducer方法,输出数据被添加到输出文件中。这整个过程的输入数据来自于分布式文件系统,中间结果缓存在本地,最终的输出又被写回到分布式文件系统。数据的多个副本不仅可以实现容错,而且能够避免节点的闲置或过载,最大化优化资源配置。

2电子商务数据管理模型

电子商务网站的主要数据是小图片,而且每个网页中的图片一般不会重复,另外,同一商家在不同地区的受欢迎程度也不尽相同;所以可以将电子商务数据做如下分类:结构化数据、小文件以及大文件。结构化数据包含用户、用户的订单等信息;小文件主要是网页数据、商品的图片以及对应的商品文本描述等;大文件一般是日志、备份信息以及索引文件等。结构化数据可以存放在关系型数据中,并利用分表、规则分库等手段解决数据量巨大的问题。Hadoop的HDFS文件系统对大文件有良好的支持,因此可以将大文件存放在HDFS中;在对系统做一定修改后,也可以存放小文件。站在用户的角度可以将电子商务中涉及到的各种信息进行分类,然后按照不同的层次组织成电子商务数据的逻辑模型。电子商务数据按照网络信息组织方式可以分为三种类型:微观、中观以及宏观。电子商务信息只经过一次组织的模式称为微观组织模式,这种信息组织模式以最直接的方式展现给用户,用户可以直接看到对应的数据,主要包括[3]:(1)普通文件数据以及自由文本数据。前者对非结构化信息进行管理的,后者一般用于全文数据库中,目的是用自然语言揭示数据库文献内的知识单元。(2)主页数据。类似于网络黄页,用主页将对机构、个人等介绍的页面集中组织起来。(3)超媒体数据。以超文本方式组织了网页上的文字、声音、图片以及视频等多媒体信息。相对微观数据模式而言,中观模式中的信息的二次组织对微观数据模式的信息进行再次组织,三次信息模式对二次信息进行再次组织。二次信息组织数据常用的有搜索引擎、主题树的形式以及数据库等。三次信息组织数据的典型代表是多元搜索引擎中的搜索引擎目录。电子商务网站主要涉及到微观和中观两种信息组织方式。微观层次上包含的数据主要有ht⁃ml文件、脚本文件、图片和视频、用户及订单数据及上述各种数据的组合。中观层面则主要是各种商品目录和搜索引擎接口。从上述分析可以看出,电子商务网站数据的逻辑模型如图1所示:图1电子商务网站数据的逻辑模型在实际实现过程中,将电子商务网站的数据模型分为多级结构:前端页面缓存(Squid)直接和用户交互,它的下一级是WebServer;WebServer往下又连接了页面片段缓存ESI和DAL数据接口,同时还会和Hbase数据库交互。前端页面缓存在接收到用户的请求后,会检查缓存中是否有用户请求的数据,如果没有,页面缓存会将请求提交到Web服务器;Web服务器从页面片段缓存中查看是否存在用户请求的数据,如果还没有将按照请求类型进行后续处理:非结构化数据请求发往HDFS,结构化请求发送到数据库。这一模型在实际使用中具有很大的优势[4]:(1)高响应性。电子商务网站的pv值一般都高达百万,模型中的前端服务器和页面片段缓存可以有效提高用户访问的响应度。(2)统一的数据接口。为存储用户及其订单数据、商品评论信息等不同类型的结构化数据,需要一个接口层来对数据库进行功能上的划分。对于非结构化数据,借助Hadoop的HDFS文件系统来存储。前端页面缓存是通过squid技术实现的,squid反向技术多用于将不同的URL请求分发到不同WEBserver,在提高电子商务网站访问速度的同时,让用户之看到反向服务器的地址,一定程度上也提高了电子商务网站的安全性。反向服务器一般位于WEBserver的前端,作为WEBserver的内容缓存。然而,在同一个商店中,不同页面的css、swf等文件可能相同,更有可能不同商店的这些文件也是相同的,这种情况下载入不同页面只需要刷新网页部分即可,此时squid技术就存在反复缓存的问题。页面片段缓存ESI技术很好的解决了这一问题,它是一种基于XML的标记语言,根本目的是在HTTP中进行资源的组装。页面片段缓存的标记能够区分出页面的静态部分和需要动态更新的页面片段,静态部分始终被存储在HDFS分布式文件系统中;动态部分在载入新页面时需要更新。squid技术和页面片段缓存ESI技术构建的缓存系统虽然可以在一定程度上提高电子商务网站的响应速度,但对于大型电商网站而言,更加高效的用户响应离不开分布式缓存;一般的Web应用会将数据存放在关系型数据库中,但海量数据的增加会导致数据库响应出现严重延时,Memcached等分布式缓存可以缓存数据库查询结果,从而降低了访问数据库的次数;在数据存储方式上,Memcached的数据都保存在内置的内存存储空间中,这无疑提高了动态Web应用的响应速度。结构化以及非结构化等不同类型的数据都存储在同一个数据库中是不现实的,电商的用户群都很庞大,为提供高效的数据库实现及不得不采取分库策略。分库策略一般是按照不同的应用及用户ID值划分数据库,并借助数据库集群实现。但是,不同的数据库存在不同的应用接口,为了对用户屏蔽这种差异性,需要利用数据访问层DAL封装对不同数据库的操作,以向用户提供统一的Webservice接口。

3云计算用于电子商务行业

当前最具代表性的电子商务网站无非是美国的亚马逊和国内的阿里巴巴。亚马逊的电子商务模式主要取决于盈利模式及经营模式两大部分,其中盈利模式主要受品牌价值、个性化服务以及渠道整合的影响。阿里巴巴的电子商务模式由取决于其运营模式,涵盖了企业站点搭建、站点推广、诚信和贸易通等。电商的商务模式是能够为其带来收益的模式,决定了电商在整个价值链中的地位。亚马逊和阿里巴巴正是抓住了整合价值链这一电商的核心,才会取得当前的成功。解决整合价值链这一难题,恰恰是云计算应用于电子商务领域的最重要原因。当云计算技术应用于电子商务行业时,会引起电子商务模式的转变[5]:(1)消费模式转变。传统的电商消费的软硬件产品许可模式是单机版的,而云计算环境下许可模式转变为SaaS模式;传统的客户消费模式是电脑网上支付,而云计算环境下的支付方式转变为移动支付。(2)应用模式转变。传统的企业应用都是基于CRM、EIP的,云计算技术应用到电商后,这些应用都可以托管到云端。(3)外包模式转变。电子商务领域的基础架构以及人才等都可以以外包的方式完成,以此实现业务的转型;这种转型方式甚至成为了电子商务中引入云计算的一种具体体现。随着智能手机的不断发展,移动电子商务也逐渐成为一种常见的商务领域,并有逐步替代传统电子商务的趋势。基于云计算的电子商务中的核心是电商企业,是价值的设计者;客户是电商的资源,电商企业为获得最大化利益,就需要利用云计算技术整合价值链,帮助用户获得享用云计算所带来的便利性。在基于云计算的电商模型中,客户是整个模型的中心,电商企业在对市场进行调研后识别客户的需求,并整合电商、运营商、设备及内容提供商等各种资源,构建起整个云计算电子商务平台。云计算平台能够整合所有参与电子商务的资源,协调并决定整个商务活动的价值走向。例如,通过云计算平台,解决方案提供商可以提供服务,电商对这些服务整合后可以再提供给用户。云计算提供商提供服务器集群,电商可以使用这些计算能力解决业务需要的各种资源。与此同时,电商的各种应用是存储在云中的,不必考虑存储及处理能力的瓶颈问题,也不需要额外购买高性能的应急设备,降低了成本需求。另外,数据的集中存储也方便全面的监控和管理,隔离的虚拟化技术又从另外一方面提供了一定的安全性[6]。电子商务活动中,信息共享及业务协作是一个重要的环节,云计算技术中资源分配的高度灵活性能够轻松实现电商、客户及其他参与者的信息共享。当有任何更新和改变时,电子商务的所有参与者都可以即时得知。

4总结

在解决大规模数据处理的问题上,云计算技术具有无可比拟的优势。它可以借助虚拟化技术和分布式计算提高后台的数据处理能力,并为用户提供统一的应用平台。电子商务是计算技术的一个典型应用领域,商务数据被部署在数据中心,并向用户提供集中式的服务。云计算技术的这些特点决定了电子商务获得可以有效降低交易成本,在降低运行负荷的情况下提高数据中心的运行效率。本文首先简单介绍了云计算技术及云计算的服务模式,并说明了云计算的核心技术;然后分析了电子商务的数据管理模型,从多个层面介绍了电子商务数据组织过程中涉及的各项技术;最后,本文阐述了云计算技术在电子商务领域的应用。

作者:米仁沙·艾尼 单位:喀什大学