数据分析对图书出版业绩的驱动作用

时间:2022-10-11 02:39:44

数据分析对图书出版业绩的驱动作用

近年来,日新月异的数字化潮流不仅不断改变着人们的生活方式,也使各个产业领域的生产方式迅速革新,处于信息传播领域前沿的出版产业自然无法逃离这一趋势的推动力。尽管阅读方式的改变对纸质出版物产生了强烈的冲击,但不容忽视的是,图书出版业也因这一潮流而被注入了无限生机。数字化的普及使得信息的传播更加畅通,存储和流通渠道扩大,这便在无形中拓展了受众群体和市场能量,为出版从业人员提供了更加多样化的机会,因为越是信息爆炸,就越是需要更加专业地对信息进行筛选、优化和传播。但如何借助大数据时代的规范性分析方式,在浩如烟海的信息大潮中捕捉有利于图书策划效率、占领未发掘的小众市场、提升出版业绩的因素;又如何根据这些信息确定最为贴合预期目标读者的图书形式、定价、印数、发行范围、宣传方式等细节;以及在图书出版后如何及时获取读者、市场的反馈信息,为后续选题策划提供参考,以形成出版产品的良性循环驱动效应,为本文试图探讨的主要内容,并将以陕西人民出版社旗下“饕书客”这一以社科文化类为主要方向的图书品牌的策划模式和实际数据为例展开具体分析。

一、通过数据分析,能够提升选题策划精准度,降低资源的投放成本

(一)数据获取的途径与方式

在传统图书流转方式下,信息极为不对称,编辑策划选题主要基于经验和直觉,这需要长时间的磨炼才能实现,并且具有很大的不确定性,近年来,由于大数据时代带来的便利条件,可获取数据信息的途径已经大大丰富,效率也不断提高,如果能结合编辑经验对数据进行筛选、积累、整理,进而借此优化选题方向,便可以大幅提高图书产品的精准度,降低资源投放成本。目前获取与图书策划相关信息的途径主要有以下几方面:①借助专业提供图书行业咨询、研究与调查服务的商业机构,如开卷信息技术有限公司,其每年会公布《全国图书零售市场报告》,并且具有付费的图书数据采集分析功能,Alexa公司可以提供各个网站最为详尽的排名信息;②对当当、亚马逊、京东、淘宝、博库等市场占有量较大的图书销售平台的有效信息进行分类整理,通过出版社内部发行机构的详细数据掌握中盘数据;③随着数据时代市场分工的细化,还可以借助更为专业的工具如Jsoup技术提取相关网站数据信息进行处理。“饕书客”进行选题策划时除参考相关组织机构公开的行业总体数据外,进行具体分析时利用的数据主要来自本社发行部门及图书销售电商后台。发行部门能够提供包括首次铺货量、网店与实体书店铺货比例、退货率、结账率、各个地区铺货比例等数据;通过电商后台可以看到单本图书每日、每周、每月、每年的销量(图1);浏览页面能够获取读者评论、相关读者的偏好、有些电商的页面还会显示评论者的购买终端以及购买地(图2)。长期收集这些信息并加以整理,对于图书策划有很大的参考价值。

(二)借助相关数据,找到目标读者购买图书的驱动力,提高成本投放的精准性

策划编辑在确定选题时首先要弄清楚的是为什么读者要购买自己即将推出的图书产品,购买者从哪里来,这些答案可以通过一定的数据分析获得。“饕书客”的编辑每周会关注所出版图书的数据报表,指标包括每本书在网上平台的销量、读者的评价(包括豆瓣等论坛的读者评价)、地面店各个地区的添货退货情况、库存等。在一定时间区间内对这些数据进行归纳分析,就能通过该图书品牌目标读者的地域分布、年龄层次、对内容的偏好等特点,基本推断出这些读者的购买动力,是对价格不敏感,忠实于内容或者是由于促销、宣传等活动随机购买,还是因为某种潮流跟风购买,根据几种类别读者所占比例决定是否继续推出或者如何推出同类图书产品。同时还要分析阻碍图书销量或者读者体验的负面因素,是因为铺货不够,宣传力度、范围、方式不妥还是定价、装帧不合适,从而对同类图书产品的形式、上市时机、宣传重点区域等各种要素进行调整。例如,从图3能够大致看出“饕书客”策划图书的地域偏好,掌握读者的地域偏好,对于后续图书产品的定价策略、营销重点和方式都有决定性的参考价值。总之,最终呈现给读者的每一个图书产品的各种要素都要经过对这些相关数据的分析、平衡才能确定,这样,才能紧紧握住把读者留下的“产品钩子”,大大提高成本投放的精准性。

二、数据分析在图书出版流程中的具体应用

(一)通过数据分析,合理定价

对于已经确定的选题,定价时除了要以成本为基础核算外,外部因素如发行折扣、印数等要素也必须加以考虑。发行折扣受图书铺货渠道影响很大,比如当当、亚马逊等电商不断推出的买赠、减价等促销活动,成本最终都将转嫁给出版社,因此会大大降低其最终给出版社的结账折扣,如某种图书的销售渠道主要在网络上,那么定价就要高一些,以保证利润率;反之,则可以低定价刺激消费。同时,还要收集其他出版社同类书的定价信息,与其相比定价如果更有优势,对销量会有一定的促进作用。如图4所示,当当网按销量排名的《北欧神话》同类书中,“饕书客”出品的排名之所以靠前,与价格优势有很大关系。

(二)借助数据分析,计算最佳印数

姚建中在《出版物需求预测的风险分析》一文中用极值原理这一现代控制理论中最优控制的数学方法,推导出一组确定出版物理论最佳印量的公式,该公式利用概率统计理论中的三角分布推导,用于在统计数据不完整的情况下确定图书最优印数,其中各个变量的值越准确,计算所得的印量就越有参考价值。其中c为最小需求量,g为最大需求量,m为最大可能需求量,U为图书积压损失,V为缺货少赚的利润。(1)当时(A)(2)当时(B)在“饕书客”对图书进行具体运作的过程中,最小需求量c为近一年内同类书的首次铺货量,最大需求量g为同类书三个月(网店铺货占比大)或半年(地面点铺货占比大)铺货量,m为发行员征订的实际数量,U为图书的实际成本(未考虑库存成本),V是以平均回款折扣计算出的利润。例如在确定《德川家康》一书印量时,c为该套书中其他品种的首次铺货量5000册;根据数据可得出该系列网店铺货占比大,故以三个月为限确定g的值为10000册;发行部门征订的数字为8000册,为m的值;经计算,U的值为13,V的值为7,那么,此时故将数据代入公式(A):所以,最佳印数N=7291册。如果持续统计公式中所需同类书的相关数据,那么所得出的这一数值便可以为发行与编辑提供可靠的参考。

(三)根据数据统计结果,确定铺货重点渠道与上市及营销时机

虽然出版社面对的是全国所有读者,但绝不能盲目地铺货,必须根据长期的数据指标分析铺货重点,才能将图书铺到最有效率的渠道,否则的话,不需要这类书的渠道退货滞后,需要的地方又没货可发,不仅仅会增加物流成本,还会让编辑陷入两难,不能准确决策印量,故而应从以下几方面进行长期考察:首先要根据已出版的同类书在网店与地面店的销量比决定铺货重点;其次,由于电商受众群体有差异,比如京东网男性用户占比大,亚马逊有文艺气息的读者占比大,因此要根据图书类别有侧重地发货,从图5可以看出不同特质的图书在各网店的销量表现明显不同;再者,不同地域、不同性质书店的销量也不相同。一定要尽量地获取一定时间段内某种书的销售重点,以最小的成本获取最大的收益(图6)。

三、结语

以前,所有传统出版人的行业决策依据都来自于中盘发行商的数据,这些数据不但十分零散,很难归纳,并且获取困难,故而在图书产品研发过程中的决策大多数依靠编辑的经验和直觉做出。然而在目前形势下,如果还不能有效获取和利用用户消费数据,传统出版商的竞争力将逐渐衰弱。因而,出版社应借助大数据时代的东风,尽量完整、及时地利用各种技术手段,长期、规律性地收集整理相关信息,建立起可以随取随用的数据管理模式。利用不断更新的数据库理解和把握图书市场的机会或降低投入的风险,以期有效地提高出版社的业绩。

作者:韩琳 单位:陕西人民出版社

参考文献:

1.栾锦骥.数据挖掘技术在图书选题策划中的应用研究[J].自动化技术与应用,2016(12):50-52.

2.王卫疆.图书策划与发行的高效契合模式分析[J].新闻传播,2017(01):60-61.

3.杨易.浅谈图书策划编辑的市场调研内容与方法[J].市场调研,2016(4):75-76.

4.姚建中.出版物需求预测的风险分析[J].出版发行研究,2001(8):37-39.

5.赵伟毅.基于数据挖掘技术的图书产品信息服务平台设计与实现[D].北京:北方工业大学,2016.

6.龚信诚.浅谈编辑的信息挖掘和数据分析能力的养成[N].中国图书商报,2013-04-09(10).

7.李汶羲.基于数据挖掘的选题策划的研究与设计[D].北京:北方工业大学,2015.