信息资源再生的统计分析论文

时间:2022-10-06 04:55:55

信息资源再生的统计分析论文

一、统计分析

1.浏览次数与回帖数分析

笔者选取浏览次数、回帖次数和每百次浏览回帖数三个指标来分析论坛信息的再生情况。浏览次数代表该信息资源被利用的情况,浏览次数越多,表明该资源被利用的情况越好。回帖次数代表资源的再生情况,回帖数越多,表明该资源被反馈而增加信息的机会越多。每百次浏览回帖数代表该资源被增加的效率,每百次浏览回帖数越大,表明该资源在利用的过程中信息量增加的概率越高。在统计时段内,对抽取的550个样本进行统计分析发现,单个帖子的最小浏览次数为113次,最大浏览次数为966209次,平均浏览次数为27449.75次,标准差为53675.487;单个帖子的最小回帖数为49个,最大回帖数为313个,平均回帖数为92.62个,标准差为41.152;每百次浏览回帖数最小为0.01,最大为50.44,平均为1.9338,标准差为3.77905。统计结果表明,论坛信息资源在利用过程中得到了发展,但是样本标准差普遍偏大,这表明不同样本帖子的浏览次数、回帖数和每百次浏览回帖数之间具有较大的差异。不同网站的帖子浏览次数、回帖次数及每百次浏览回帖数的统计情况见下表1。对每个帖子的浏览次数进行单因素方差分析发现,不同网站的浏览次数具有显著性差异(F=8.014,p<0.01),新浪论坛的帖子浏览次数显著高于猫扑论坛和网易论坛,猫扑论坛和网易论坛的帖子浏览次数之间不具有显著性差异。对每个帖子的回帖次数进行单因素方差分析发现,不同网站的回帖次数具有显著性差异(F=5.445,p<0.01),网易论坛的帖子回帖次数显著高于新浪论坛和猫扑论坛,新浪论坛和猫扑论坛的回帖数之间不具有显著性差异。对每百次浏览回帖数进行单因素方差分析发现,不同网站的每百次浏览回帖数具有显著性差异(F=14.684,p<0.01),新浪论坛的每百次浏览回帖数显著低于网易论坛和猫扑论坛,网易论坛和猫扑论坛的每百次浏览回帖数之间不具有显著性差异。浏览次数体现了有效的用户数,每百次浏览回帖数说明了用户在浏览帖子的过程中回帖概率的高低。以上数据表明不同网站不仅在有效用户数上存在差异,而且在用户参与网络回帖的积极性上也存在差异。对不同版块的帖子浏览次数进行单因素方差分析发现,不同版块的帖子浏览次数具有显著性差异(F=4.504,p<0.01),教育版块的帖子浏览次数显著高于财经版块和旅游版块,数码版块的帖子浏览次数显著高于财经版块;其他版块的帖子浏览次数之间没有显著性差异。对不同版块的回帖次数进行单因素方差分析发现,不同版块的回帖次数具有显著性差异(F=7.834,p<0.01),教育版块和旅游版块的回帖次数显著高于财经版块和数码版块,其他版块的回帖次数之间不存在显著性差异。对不同版块的每百次浏览回帖数进行单因素方差分析发现,不同版块的每百次浏览回帖数具有显著性差异(F=4.300,p<0.01),数码版块的每百次浏览回帖数显著高于财经版块、教育版块和旅游版块,财经版块、教育版块和旅游版块三者之间不存在显著性差异。以上数据表明,不同版块之间的有效用户数和用户参与回帖的积极性也具有显著差异。

2.回帖内容分析

由于论坛取样并非来自专业教育网站,因此论坛帖子的回帖内容的构成比较复杂。为了分析网络论坛中回帖内容的构成与质量,笔者对所有的回帖内容进行了编码,分为四类:增加信息内容、支持的内容、反对的内容和无价值内容。其中增加信息内容包括补充新内容、提出建议、提问和提示三类,支持的内容包括支持原帖内容和支持回帖内容两类,反对的内容包括反对原帖内容和反对回帖内容两类,无价值内容包括重复他人观点和无关广告两类。网络论坛中不同回帖内容的数量统计见表3。结果表明,在所有的回帖中,表示支持的内容所占份额最大,达到47.88%;其次是增加信息内容和无价值内容,分别为23.99%和20.84%;表示反对的内容最少,只有7.30%。对四类回帖内容的百分比进行单因素方差分析表明:不同网站在增加信息内容类帖子的百分比上具有显著性差异(F=14.984,p<0.01),网易论坛增加信息内容类帖子百分比显著高于新浪论坛和猫扑论坛,新浪论坛和猫扑论坛之间无显著性差异;不同网站在支持内容类帖子的百分比上具有显著性差异(F=11.779,p<0.01),新浪论坛表示支持内容类帖子的百分比显著高于网易论坛和猫扑论坛,网易论坛和猫扑论坛之间无显著性差异;不同网站在反对内容类帖子的百分比上具有显著性差异(F=8.523,p<0.01),猫扑论坛表示反对内容类帖子的百分比显著高于网易论坛,网易论坛表示反对内容类帖子的百分比显著高于新浪论坛;不同网站在无价值内容类帖子的百分比上无显著性差异。网络论坛中不同版块回帖内容的百分比构成见表5。对四类回帖内容的百分比进行单因素方差分析表明:不同版块在增加信息内容类帖子的百分比上具有显著性差异(F=2.951,p<0.05),财经版块增加信息内容类帖子的百分比显著高于数码版块和旅游版块,其他版块之间并无显著性差异;不同版块在支持内容类帖子的百分比上具有显著性差异(F=15.491,p<0.01),财经版块在支持内容类帖子的百分比上显著低于其他三个版块,其他三个版块之间无显著性差异;不同版块在反对内容类帖子的百分比上具有显著性差异(F=3.434,p<0.05),财经版块在反对内容类帖子的百分比上显著低于数码版块和教育版块,其他版块之间无显著性差异;不同版块在无价值内容类帖子的百分比上具有显著性差异(F=12.109,p<0.01),财经版块在无价值内容类帖子的百分比上显著低于其他三个版块,其他三个版块之间无显著性差异。

3.信息资源再生的用户统计

由于网络论坛中常常允许用户匿名参与论坛回帖,所以在进行信息资源再生的统计中并没有统计匿名用户的情况。在调查时段内,三大网站的四个版块共计有注册用户22877个。在这些注册用户参与论坛回帖的过程中,用户参与的帖子数最少为1个,最多为47个,平均为1.337个。其中只参与1个帖子的用户达85.6%,97%的用户参与帖子的数目不超过3个,99%的用户回帖数不超过6个。统计结果显示,在注册用户中用户回帖数最少为1个,最多为633个,平均为2.17个。其中只回帖一次的用户占77.7%,95%的用户回帖数不到4个,超过17次回帖的用户只占总用户数的1%。从网络信息资源的再生来看,最有价值的是增加信息内容。考虑到无法对用户单个回帖的影响进行判断,而且大部分的用户只参与了一个帖子的回复,笔者对用户回帖进行了如下处理:即分别计算用户回帖中增加信息内容占该用户发帖总数的比例,将这一比例大于等于80%的用户定义为高价值组,将这一比例小于等于20%的用户定义为低价值组。高低价值组参与帖子数的比较情况见表6。笔者通过比较高价值组和低价值组参与帖子数的差异发现,他们之间具有显著性差异(F=357.971,p<0.001),高价值组参与帖子回复的平均数(1.0420)显著低于低价值组参与帖子回复的平均数(1.2802)。对两组用户参与帖子回复的次数进行进一步的分析发现,99.8%的高价值组用户参与帖子回复的次数小于等于4个,参与回复的最大帖子数为12个;而在所有参与帖子次数高于4次的用户中,97.38%的用户处于低价值组,只有2.62%的用户处于高价值组。

4.发帖者自顶帖分析

在网络论坛中,一个完整的帖子包括发帖者发表的原始帖和跟帖者发表的跟帖,其中跟帖者发表的跟帖数量各不相同,跟帖者的组成相对比较复杂,任何人都可以跟帖。在网络论坛中还存在这样的现象:发帖者参与到帖子的回复中,成为回帖者,甚至在有些帖子中,发帖者本人成为帖子的最多回帖者。笔者将发帖者同时也是最大回帖者的帖子称之为自顶帖,自顶帖在网络论坛中是一种非常常见的现象。通过对自顶帖和非自顶帖的回帖内容构成进行独立样本卡方检验发现,自顶帖和非自顶帖在内容构成上存在差异,自顶帖和非自顶帖之间在增加信息内容类帖子的百分比(F=64.396,p<0.01)和反对内容类帖子的百分比(F=13.787,p<0.01)上存在显著性差异,自顶帖增加信息内容类帖子的百分比显著高于非自顶帖内容,反对内容类帖子的百分比低于非自顶帖;自顶帖和非自顶帖在支持内容类帖子的百分比和无价值内容类帖子的百分比之间均无显著性差异。在所分析的550个论坛帖子样本中有201个帖子的最大回帖者是发帖者本人,占总数的36.5%。可见,各个网站和版块的论坛中都存在自顶帖现象。不同网站和版块中的自顶帖数量分布情况见表7。笔者通过对其进行差异性检验发现,不同网站的自顶帖数量之间存在显著性差异(F=10.935,p<0.01),猫扑论坛的自顶帖数量明显低于新浪论坛,新浪论坛的自顶帖数量明显低于网易论坛。不同版块的自顶帖数量之间也存在显著性差异(F=25.252,p<0.01),数码版块的自顶帖数量明显低于教育版块,教育版块显著低于旅游和财经版块,旅游和财经版块之间无显著性差异。

二、研究结果与讨论

1.网络论坛中交互程度低

许多研究者指出,网络论坛中不同的交互深度会产生不同的学习效果。黎加厚将网络行为中的交互深度细分为三类:“浅度互动”是指仅用为数不多的字句认同和赞赏博文和作者的表述,以及摘录文章中的精彩语句并表态;“中度互动”是指简单地分析,粗略地表达观点,或简要描述个人行为的交互程序,包括回复者与作者分享心得体会;“深度互动”是指能深入反思博文主题,提出个人独立的见解和观点。(黎加厚,2009)以网络论坛为样本,从调查统计的结果来看,网络论坛中的交互深度远远没有达到我们的预期水平,主要体现在以下三个方面:第一,内容比例失衡。从论坛的回帖内容来看,目前的网络论坛中有价值的内容偏少,有用信息只占回帖总数的23.99%,大部分回帖内容只是表示支持或反对某些观点,或者发表一些没有价值的内容或广告。论坛回帖主要是浅度交互的内容,中度交互的内容非常少,深度交互的内容更少。同伴之间的相互质疑、相互交流是推进讨论进一步发展的动力,是促进资源利用者进行深入思考的保证。但是笔者发现,网络论坛中大部分的回帖都是表示对原帖或跟帖内容的简单支持或者反对,这与我们传统的交流过程存在较大的差异。在传统的交流过程中,双方的交流是双向的,而且双方在明确知道对方的意思后往往是通过认真的思考来完成信息的交流。如果一方仅仅通过回答同意、反对或提供无关信息等来回应他人,这种交流过程将无法真正完成。但是通过对统计结果的分析,我们可以看出,网络中的交互过程主要是按照这种单向的交流过程进行的,这说明网络论坛中的交流方式与传统的交流方式存在差异,也说明网络论坛中的交互深度不够。第二,支持与反对的比例失衡。统计结果表明,在论坛回帖的过程中,表示同意的回帖数有24392条,而表示反对的回帖数只有3718条,支持回帖次数是反对回帖次数的6.56倍。这说明用户对网络论坛中的帖子内容,表示支持的概率远远大于表示反对的概率。进一步分析发现,在所统计的550个帖子中,共有514个帖子其支持内容的回帖数大于反对内容的回帖数,只有36个帖子其反对内容的回帖数大于支持内容的回帖数,前者是后者的14.3倍。Gunther指出,网民们在网络上寻找信息的过程中,高卷入度必然引发详尽分析,并由此而引发更多的拒绝。(Gunther,1992)如此低的拒绝率表明用户在网络论坛中的卷入度不够。另外,论坛中这么多人表达支持的意思,并不能表明大部分的人都支持原帖的观点,这是因为论坛中的回帖内容可能更多是回帖者不经过仔细思考而匆忙表达出自己的赞成或反对之意,而至于自己在回帖中所解构出的意思是否是自己思维的结果,或者说是否表达了自己的真实意愿,就显得不是很重要了。第三,用户对网络论坛中的内容缺乏深入思考。主要体现在两个方面:一是对网络论坛中的内容真伪缺乏判断,二是对内容评价缺乏多维指标。网络论坛中,用户通常根据自己的直觉而不是根据自己已有的经验来综合判断信息的真伪,因而对论坛中的信息要么盲目相信,要么简单否定,更不会利用网络对这些信息的真伪进行证实。例如,用户在接受信息时通常会随大流,对于非主流观点通常会进行选择性忽视,对于与自己的观点相左的回帖与信息也会进行选择性忽视,而很少能够对不同的观点进行批驳,或者详细论证自己的观点。因此,在网络论坛中常常可以发现,论坛的交流过程常常是简单的附和与争吵的过程,而不是讨论。

2.网络论坛的影响因素分析

在以网络论坛为代表的信息资源再生过程中,不同网站和版块的回帖内容构成,以及不同用户在提供信息资源的数量和质量上都存在差异。网站和版块的差异体现了规则的差异,版块差异还体现了主题的差异,用户差异更可以上升为用户角色的差异。由此,网络信息资源再生的影响因素可以归纳为平台机制、网站与版块规则、用户差异与主题差异等几个因素。在信息资源再生平台的运行过程中,网站和版块规则是营造网络文化氛围的基础,用户的行为都必须遵循这些规则。如果用户违反了这些规则,就会受到惩处,如被删帖,被禁止发言,甚至被封号等。虽然用户信息资源再生行为建立在网站和版块规则的基础之上,但是随着用户网络行为的不断进化,也有可能与网站及版块规则存在冲突。当冲突产生时,网站和版块管理员既可以对违规行为进行纠正,也可以通过修改规则来响应用户的需求。在调查过程中,不同网站和版块在内容构成上所体现出来的差异,首先就受到网站和板块规则的制约。主题是信息资源再生的核心,用户的信息资源再生行为必然要围绕相关主题而进行。主题首先会影响用户群体的选择,用户通常会参加自己感兴趣的网络活动。其次,主题是否专业会直接影响用户群体规模的大小,主题专业性越强,平台的专业选择性就越强,用户群就越小;相反,平台越大众化,平台的专业选择性就越弱,用户群就越大。再次,论坛主题也会影响论坛内容的选择。在用户参与信息资源再生的过程中,用户要想使自己或生成的内容具有较大的社会影响,必然会注意发帖与平台主题的相关性,并将内容到相关主题的版块内。如果再生内容与原始资源没有相关性,那么其影响也会很小,难以真正发挥其作用。在网络论坛中,回帖通常要围绕原始资源的小主题和版块的大主题而进行,所有内容通常要围绕论坛主题这个核心而展开。不同主题会影响用户的行为差异,使得不同网站和版块的信息资源再生体现出差异性。而相同网站的不同版块的回帖差异,从侧面也反映了主题对信息资源再生的影响。信息资源再生过程中网络用户之间也存在差异。“尊重动机”是论坛参与的动机之一,即网民希望通过在论坛中的发帖行为,获得他人的尊重、信任和赞赏,以期确立自己的地位和声望。(陈然,2012)一些用户由于前期发帖所形成的号召力,成为网络中的权威人物。权威人物由于前期网络行为产生的信誉而形成榜样作用,成为其他用户模仿的对象,并影响其他用户的网络行为。权威人物在建立威信的同时对版块规则的制定也会产生一定的反作用,甚至影响版块规则的制定。网络行为不是一个人的网络行为,而是群体网络行为的合集。个人行为也不是网络行为的全部,没有网络大众的参与,网络信息资源的再生就无法实现。如果网络用户的行为与网络社区文化相左,就要不断调整自己的行为使之适应网络社区文化的要求,否则就离开这个网站,寻找新的适合自己行为特点的网站。权威用户的行为只有受到广大用户的响应,才能成为榜样;如果其行为受到用户的抵制,也要通过不断修正自己的行为来迎合用户的期望。另外,群体网络行为习惯也可以反作用于规则。当规则和群体行为发生冲突时,如果不能通过调整规则等方式来协调群体行为,很有可能会导致用户群的离去。

三、总结与展望

本研究对网易、新浪和猫扑三个网站的财经、教育、数码和旅游四个版块的550个帖子的回帖内容进行统计分析发现,不同论坛网站以及相同论坛网站中的不同版块在帖子浏览次数、发帖次数、每百次浏览回帖数、发帖内容构成、发帖者自顶帖次数等方面存在显著性差异。网络用户参与的帖子数与用户回帖质量相关,参与帖子过多的用户其回帖质量较差。网络论坛中用户回帖质量较差,主要体现在内容比例失衡、支持与反对的比例失衡、对网络论坛中的内容缺乏深入思考等方面,其根本原因在于网络论坛中的交互程度过低。不同网站、不同版块之间的回帖内容存在差异的原因包括:不同网站和版块的规则制定存在差异,有效用户群的大小和构成不同,以及论坛主题的差异。在网络论坛的利用过程中,这些因素造成了用户回帖内容和网络行为的差异。本研究也存在一定的局限性。例如,由于统计方法的限制,对高价值和低价值用户的划分只能依据样本中回帖内容的分类,而不能根据用户回帖对其他用户的影响来进行划分。另外,网络论坛中回帖的质量参差不齐,能否把它们全部称之为再生资源也值得商磋。这些问题也是后续研究需要解决的问题。

作者:何向阳熊才平单位:湖南第一师范学院信息科学与工程学院华中师范大学教育信息技术学院