网络统计范文10篇

时间:2023-03-29 02:53:44

网络统计

网络统计范文篇1

随着数字图书馆的建设,图书馆馆藏资源数字化的快速发展,图书馆以网站的形式向读者提供信息资源的服务越来越多,这些服务有图书馆门户、馆藏资源检索、光盘数据镜像、电子书刊、网络数据库、自建数据库和虚拟参考咨询等等,为了揭示网络环境下读者对这些信息资源的浏览情况、阅读情况以及访问变化趋势,准确了解读者需求分布和需求增长等情况,从而对网络读者的信息资源寻求行为模式进行研究,以便能为读者提供更好的服务,图书馆须了解以下几个问题:网络读者是如何访问网站的,这些信息资源是如何被访问使用的,如何评价这些信息资源的利用情况等等。为了回答这些问题,我们通过本系统对图书馆多个信息资源网站进行读者访问流量统计、热点网页访问统计、读者访问来源统计析及各项专题访问统计等研究,并根据统计结果反映的读者需求分布和需求增长等数据对信启、资源网站的架构、界面的设计、的内容加以修改和调整,以满足读者需求为目标,吸引了读者的目光,提高了图书馆信息资源建设和服务水平。

本系统通过对信息资源的访问记录进行统计分析来了解读者的信息需求,这种量化的方法具有客观和经济的优点,还可配合调查研究法得到更实际的结果,并以此探讨网络信息计量学在对信息资源使用成效进行评估的应用,包括所遭遇的困难及应对之道,以期为信息资源的访问评估与改进寻找可行的方法。

2系统的实现

访问量的多少是衡量网站是否成功的重要标准,但对于图书馆网站是远远不够的,图书馆需要获取完整的读者访问流量统计数据,来对图书馆信息资源的使用情况进行分析,网络信息计量学方法是目前网络界普遍采用的网站绩效评估计量法,被认为是可以用科学的方法检验网站访问数据的一种工具。它的目的包括了解网络读者的行为、确定网站是否吸引适当的读者来访、评定网站建设策略是否得当。其实施步骤可分为三个阶段:

(1)记录网站的访问数据;

(2)分析记录数据;

(3)为网站建设策略的改进提供依据。

2.1系统原理

由于网络站点和数据库本身具备了访问计量功能,各自的信息资源收藏状况便于人们掌握,并且能自动记录读者访问的登录情况,如登录名、登录时间、浏览文件、读者的来源地址等,这些数据资料能够准确反映读者访问信息和来源分布等情况,所以依据图书馆网络读者访问统计的工作内容,制定相应的分析指标,并收集网络读者访问图书馆信息资源站点形成的日志文件,然后利用日志统计工作软件定时对日志文件进行处理,得到统计数据,并动态生成各种表达形式的能满足图书馆各项统计分析工作的报表。最后把生成的分析报表导入到数据库中出去。

图书馆各个网络资源站点建设人员可通过浏览网络读者访问流量统计分析报告,分析和了解读者的访问需求,从而做好网络信息资源的建设工作。

读者行为分析研究则可通过对分析报告进行质化研究,并结合一般调查法、咨询研究法对读者的信息寻求行为进行研究。

本系统还可利用统计分析的结果来对系统自身工作进行评估和调整。

2.2分析指标

传统图书馆的分析指标和计量方法,虽然和数字化图书馆有很多不同,但使用的目的及计量的准则并没有太大实质性差异[4]。

参考传统图书馆的分析指标以及国内外类似的研究结果选定了下列10个分析指标:

(1)读者到访人数和潜在读者人数的百分比;

(2)到访读者表现了阅读的兴趣的百分比(采取明显的阅读行动);

(3)可能的读者转为经常的读者的百分比(经常阅读、下载资料);

(4)读者的持续度(重复到访读者);

(5)读者的忠诚度(网页浏览次数、再度到访的次数及时间长度);

(6)读者停止阅读行为的百分比(阅读行为半途中止);

(7)读者耗损率(现有读者中停止阅读行为者的百分比);

(8)读者动摇率(耗损的读者/到访读者的总数);

(9)读者最近到访时间(据上次到访的间隔时间);

(10)读者到访频率(多久到访一次)。

就此参数,我们可以从一个客观的角度来观察和评估图书馆网络读者访问情况。

2.3系统框图

网络读者流量统计分析系统功能框图

2.4工作方法

本系统工作方法主要是采集网络读者访问过程日志进行量化分析法,它的优缺点见表1。

读者访问过程日志分析法优缺点

量化分析法重视量的分析,本系统通过对访问过程日志以量的方法加以统计分析,首先根据为了研究读者需求分布和需求增长情况这一目的将研究内容归类成若干分析单元,接着将分析单元以数量的方式加以表达,进而以此为解释读者信息寻求行为的依据。

2.5技术实现

(1)系统结构

本系统是以浏览器/服务器/数据库体系结构作为基本架构,通过ASP方式实现交互式、动态的读者访问日志统计分析系统。系统结构框架如图2所示:

读者访问日志统计分析系统结构框图

(2)系统组成模块

本系统有六个模块组成:访问日志入库、访问流量分析、被访页面分析、来访读者分析和统计分析图表。

(3)系统运行环境与开发平台

本系统运行环境和开发平台如表2。

读者访问日志统计分析系统模块

表2系统运行环境及开发平台一览表

软件类别软件名称

数据库SQLServer2000+FastTrendsDatabase

操作系统Windows2000SP4Server+Aix4.3.3

Web服务器软件IIS5.0+Apache3.0

浏览器软件IE5.5

网页制作Frontpage2000+javascript

ASP工具EditplusTextEditor

编程语言VisualBasic6.0

图表软件Excel2000

(4)程序流程与代码实现

该系统由main.asp(主界面程序)、flux.asp(小时、日、星期流量分析)、target.asp(被访页面分析)、visitor.asp(来访读者分析)、chart.asp(统计分析图表)五个组成。

我们以“被访页面分析”模块的程序流程和代码说明系统组成模块的实现过程,该模块程序流程图如图4。

“被访页面分析”程序流程图

相应代码:

<table

<tdclass=定义的表格形式及表头>

Setconn=server.creatobjectl("adodb.connection")

conn.open"dsn=dsn_dbs;uid=xxx;pwd=xxx"

Setre=server.creatobject("adodb.recorderset")

re.activeconnection=conn

dbname=Application("logtime")——数据表名称

re.open“QL语句”

dowhilenotre.eof

执行Recordset操作,服务器进行统计计算

response.write——写入统计表

re.movenext

loop

re.close

程序中一些代码说明:

①Recordset的Open方法:允许用户向数据库发出请求,通常是运行sql命令。如:Sqlquery="selectlogtimefromintemetlogwhereday(logtime)=day(getdate())andmonth(logtime)=month(getdate())andyear(logtime)=year(getdate())"Dbrs.opensqlquery,dbconnection,3,3

②Recordset的RecordCount属性:可以取得当前在Recordset对象中的记录条数。如:setdbrs=server.createobject("ADODB.recordset")amount=dbrs.recordcount

③Recordset的MoveNext方法:移动指针到Recordset对象的下一条数据。如:Dbrs.movenext

④Response的Write方法:负责将字符串信息输出的用户端。如:Response.write“页面总访问量:“&amount&”<br>

⑤Recordset的Close方法:可以用来关闭指定的Recordset对象。如:Dbrs.close

2.6系统运行过程

下面以西安交通大学图书馆网站为统计分析对象说明该系统运行过程。

首先我们用FTP工具抓取网址为的服务器,时间段为2003/01/01到2003/12/31的访问日志导入到数据库中,该服务器完成图书馆网站的部分功能:门户信息、OPAC、馆际互借、电子期刊、网络数据库、网络资源、参考服务等。

对日志分析系统进行运行参数设置:读者访问时间间隔设为20分钟;从最新QQ显IP版软件中导出读者IP地址分配资料,转换格式后导入到日志分析系统的地址表中,以便对读者分群;设置过滤规格文件滤掉一些无用的访问信息,如背景图片、图书馆Logo,页面美化图片和服务器漏洞扫描日志等日志信息,然后对服务器访问日志进行初步统计分析,保存统计分析结果准备进行进一步统计分析。

最后利用精致多样的统计分析方法对初步统计结果进行统计分析,统计分析出的数据有:一年内资源点击与访问计数;一年内网站中最常使用的资源与服务;一年内点击次数最多的读者;一年内务分群读者的点击次数比例;一年内点击次数与阅读次数的变化;一年内上网的读者与累积成长趋势;一周各天的平均点击次数;一天内各时段的平均点击次数;校内各区读者点击次数比例;各项相关资源被使用的情形等等。这些数据可用Eexel软件生成直观的统计分析图表,部分图表详见实际应用一节中。本系统的研究主要采用访问过程日志分析法,以内容分析法、问卷调查法辅助研究。主要考虑:一是这种方法在电子商务和其它网络应用的量化分析,已经有许多研究成果,可使我们的研究更为便利;二是可以经济的,较具体客观的分析到网络读者信息需求特性;三是通过定量的计算,定质的分析,形成一种综合分析的方式,以求分析结果更为客观和科学。

3实际应用

从2002年开始,我们从图书馆门户网站读者访问计数开始了网络读者访问统计工作,从最初的图书馆首页访问计数到现在应用网络读者访问流量统计分析系统到以信息资源站点、数据库为单元的访问利用上,取得了不少研究成果,下面我们介绍以2003年西安交通大学图书馆网站读者访问日志为统计对象,获得的一些统计分析结果。

表3是2003年图书馆网站的资源浏览次数,访问次数与访问读者数的统计表,我们看到一年内资源的浏览次数是10,222,296,访问次数是1,617,166,访问读者是310,628,对照2003年西安交大统计公报教职工5341人,在校学生32766人的数据表明图书馆网站有很高的访问量。另外网络访问读者310,628远远大于学生和教职工的总和,表明有相当多的读者使用本馆的资源,这说明本馆的信息资源丰富,吸引了很多读者。网站不足之处是自建的外文资源很少。从表3看,来自国内访问占6.43%,来自国外访问占0.01%。综合以上资料,西安交大图书馆网站为校内外读者提供了方便、丰富的资源服务,吸引了大量的读者,但在国外的知名度很低,现有资源不能吸引国外读者,对此图书馆采取一些措施,来解决这个问题。

①建设网站的英文版本;

②把本校和本地一些有特色的文化资源数字化后,做成中英文全文数据库。如钱学森多媒体数据库、江南制造局多媒体数据库;

③参与中外数据库合作建设项目,如中美百万图书项目。

表3图书馆网络读者和资源浏览访问统计(01/01/2003-12/31/2003)

浏览网页数网页访问数(资源)10,222,296

平均每日的访问网页数28,006

访问者会话数访问者会话数1,617,166

平均每日访问者会话数4,430

国际范围内的访问者百分比0.01%

未知区域内的访问者百分比39.55%

来自China的访问者百分比60.43%

访问者数单一访问者数310,628

接着我们看一年间网络读者常使用的网站资源与服务,图5显示的是读者最常使用的前十项网站资源与服务以及它们占全部浏览次数的百分比。从图中我们观察到前十项占了访问量的43%,第一项是图书馆首页,然后依次是网络数据库、联机公共目录查询、中国期刊网……,这说明图书馆网站的资源内容设计与规划合理,读者访问资源方便,相关信息更新及时,受到了读者的欢迎。另外,网络数据库和联机公共目录访问比例接近说明读者并重利用印刷型资源和数宇化资源,数字化资源对科研和教学的作用日益明显。从图5中我们还观察到所有的电子数据库访问所占比例值呈现出指数下降的趋势,这说明较少数数据库的访问量较大,而较多数数据库访问量较少,根据这个特点,图书馆在采购数据库时可采取不同的采购策略,对于使用量大的数据库保证数据的更新量和连续性,则可满足约80%的读者信息需求,对于较多的使用量少的数据库可采用合伙采购共同使用的办法,来满足约20%的读者信息需求。

图书馆网站前十名资源与服务以及它们占全部访问次数的比例(01/01/2003-12/31/2003)

接下来我们来分析常访问的读者及其来源,首先,图6中表示网络读者访问次数的分布,从图6中可以看出75.15%的读者只访问过一次,9.86%的读者访问过两次,6.49%的读者则经常访问图书馆网站,这说明作为一个为大学教育和科研服务的信息中心,图书馆的网络资源已经有了固定的读者,但还有大量读者的信息需求不能满足,为此图书馆通过参加一些文献信息资源建设项目和组织,如中国高等教育文献保障体系(CALIS),陕西省科技情报协作网等,以便获取更多优质的文献信息资源,增强图书馆文献信息资源的保障能力。另外,图书馆信息资源大多数有访问权的限制,校外的读者无法接触到,为此图书馆采取了一些办法,如建立电子数据库导航库,电子期刊导航库,提供文献传递等服务来满足校外读者的信息需求。表4是常来图书馆网站的读者统计数据,可以观察到前二十名读者绝大部分是西安交大校园网的读者占全部来访数的4.61%。如果以其上网所属机构来划分来访的网络读者,图7是前十名各类机构网络读者的访问。从图7中,我们可以清楚的看到本校的用户占73%,其中来自科学馆的访问占3.23%,图书馆的读者占3.18%,西一楼的2.34%,可见西安交大的校园网比较普及,读者能够很方便的进入图书馆资源网站,这也表示图书馆提供给读者阅读电子资源的电子阅览室满足了读者需要。在图7中数据显示,外校的读者也经常访问图书馆网站,如西安理工大学的读者占0.33%,长安大学的占0.31%,北京大学的占0.05%,西北工业大学的占0.17%,上海交大占0.08%等等,这些读者主要使用联机公共目录查询和使用自建数据库,这说明高校间的信息共享正在发展,图书馆应该加强自建特色数据库的建设,增强文献传递和馆际互借服务,满足这些读者的信息需求。

表4访问图书馆网站次数最多的前20名读者及他们占的比例(01/01/2003-12/31/2003)

网络读者访问统计

访问者点击数点击率访问者会话数

1202.117.14.71293,4440.54%2,893

2202.117.14.15112,2490.2%2,846

3202.117.29.37347,2230.64%2,554

4202.117.0.980.7000.15%2,487

5202.117.29.59121,1840.22%2,427

6202.117.39.47114,6290.21%2,290

7202.117.48.45174,1300.32%2,120

8202.117.14.24147,5000.27%1,997

9202.117.35.1156,3120.1%1,985

10202.117.48.5196,2100.17%1,839

11202.117.35.79223,5650.41%1,792

12202.117.48.101107,6310.2%1,785

13202.117.48.103110,1800.2%1,775

14202.117.24.8414,6520.02%1,764

15202.117.48.4492,7760.17%1,726

16202.117.29.58121,7560.22%1,678

1764.241.242.182,1310%1,673

18202.117.48.7751,6820.09%1,654

19202.117.29.136103,9240.19%1,623

20202.117.27.13109,4290.2%1,605

以上访问者合计2,481,2074.61%40,513

总数53,733,901100%1,617,166

接下来我们来观察各类读者在每个月访问网络资源的比例变化图,见图8是各类网络读者访问前十名网络资源的变化图,总体访问变化的趋势和学校的校历安排有明显的关系,每个数据库的访问量变化则和各类读者的信息需求不同有关系。这反映了读者的结构影响着网站的使用情形。

网络读者访问图书馆网站次数分布(01/01/2003-12/31/2003)

前十名各类主机访问图书馆网站的访问次数(01/01/2003-12/31/2003)

各类网络读者对前十名网络资源访问变化图(01/01/2003-12/31/2003)

由于篇幅有限,我们简单介绍了本系统对图书馆网站网络读者访问流量的统计分析结果,在以上的讨论中,可以观察到读者利用网络信息资源是联机公共目录检索和信息检索并重,且大部分读者是本校的。

通过上述讨论,我们知道本系统还有许多值得进一步研究之处,下一步的研究方向是收集更完整的读者访问日志,包括更长期的和所有与图书馆资源访问相关的。并且尝试利用精致的统计方法来分析,以达到对网络读者行为更精确的解读。

4结语

经实际应用证明,该系统对我馆信息资源建设起到了重要的促进作用。首先,在控制我馆信息资源存放空间问题上,虽然目前看来效果不明显,但如果越来越多的信息资源杂乱无章地占据信息空间,将会大大降低信息检索的效率,干扰核心信息源的利用。本系统可以提供调整信息存放的定量依据,在探明各类型信息资料数量特征的基础上,分析其增长和老化规律,判断信息的价值和时效性,使有价值的信息充分地发挥作用,使信息空间得到有效的利用。

其次,在“以人为本”的理念指导下,图书馆走出了单纯提供馆藏信息资源为中心的定位,着眼于满足读者广泛的信息需求。在本系统的指导下能实现这个目标:一是根据信息资源规律反映出的学术动态和信息利用规律反映出的需求动态,指导图书馆的馆藏资源建设。二是通过对信息资源利用规律的研究,使计算机信息检索系统走向科学化、规范化,从而方便用户查询。

在整个研究过程中,取得了一些研究成果,也发现有不少问题等待我们进一步的研究,首先是无法取得确实充分的数据,主要问题是图书馆提供的网络数据库是联接到厂商的数据库中去检索的。如果图书馆自己没有服务主机,那么就要请厂商提供访问数据,虽然厂商都会提供月报表,但是能够判读的资料不多,或是他提供的数据不标准,或是他提供资料不是图书馆想要的。其次不易解释数据,有了访问过程记录数据,可是怎么去解释它?读者从哪里来,做什么,这个比较容易解释,可是要知道读者做某件事的动机,就没有办法从数据中去解释了。

【参考文献】

1WonsikShim,CharlesR.McClure,JohnCarloBertot&JamesT.Sweet.ARLE—MetricsProject:DevelopingStatisticsandPerformanceMeasurestoDescribeElectronicInformationServicesandResourcesforARLLibraries:PhaseOneReportTallahassee,FL:InformationUseManagementandPolicyInstitutc,SchooloflnformationStudies,2000./stats/newmeas/emetrics/phaseone.pdf(AccessedSep.10.2001)

2詹丽萍.E-metrics在数字图书馆使用评估的应用.数字图书馆与数字博物馆趋势研讨会,2001:21-30

3邹菲.试论网络信息计量学在数字图书馆中的应用.图书情报知识,2001(1):16-20

网络统计范文篇2

2、涉密网是*市统计局内部的涉及国家秘密信息处理和信息传输并支持办公自动化(OA)系统运行的独立专网,该网与因特网实行物理隔离。局内凡是处理、传输和查询涉密信息的计算机应连入该网。

3、非涉密网是*市统计局的非涉及国家秘密统计业务处理和信息传输的主干网,局内各处室凡符合网络前台环境的计算机均可连入该网。

4、因特网是*市统计局对外信息的窗口和采集企业信息的重要通道。局内各处室因工作需要连接因特网的计算机经批准可通过非涉密网接入因特网。未经批准不得随意扩大上因特网的范围。

5、我局计算机上网管理工作由计算站负责。

6、业务网由计算站统—管理,统—分配IP地址。在业务网络上需要使用公共计算机资源(网络打印机)的用户,需办理“*市统计局网络计算机资源申请表”由计算站安排实施。

7、上网用户在工作时间内不得使用网络炒股票、玩游戏、下载影片等与本人工作无关的事情。

8、遵守国家有关法律、行政法规,严格执行国家安全保密制度;不得利用国际互联网从事危害国家安全、泄露国家秘密等违法犯罪活动,不得制作、查阅、复制和传播妨碍社会治安和淫秽色情等有害信息。发现有害信息应当及时向有关主管部门报告,并采取有效措施,不得使其扩散。

网络统计范文篇3

统计网络信息工作实行由局统计信息化领导小组统一领导,分级负责的管理制度。由局办公室、综合处、计算站各单位的主要负责人负责本单位的统计网络信息审核工作,各单位确定信息员负责统计网络信息资料的整理、报送工作。

二、信息组织

1、各处室站提供上网的各类文字资料,包括统计工作动态、统计工作信息专报、课题研究和各种简报。

2、办公室除第一条内容之外负责提供国家、省、市有关统计工作方面的重大改革措施和重大决策以及重要工作部署的贯彻落实情况、各类文件通知、领导活动、组织机构、党建工作和局内概况等相关文字资料。

3、各专业处室除第一条内容之外负责提供统计资料、统计信息,按月提供统计月报、季报、年报数据,并负责提供统计制度、统计指标等相关文字资料。

4、综合处除第一条内容之外负责提供统计资料、统计信息,按月提供经济运行报告、西部资料、州地资料、重点城市、区县目标、统计公报等相关文字资料。

5、法规处除第一条内容之外负责提供统计法规、统计执法动态等相关文字资料。

6、普查处除第一条内容之外负责提供各类普查方案、普查工作动态等相关文字资料。

7、计算站负责提供统计信息化建设情况、软件介绍及下载、杀毒软件维护、技术支持等相关文字资料。

8、各区、县统计局负责提供区、县统计信息、分析资料、工作动态等相关文字资料。

三、统计网络信息审核制度

各区、县统计局,本局各处室站在报送网络信息前,必须认真填写《*市统计局统计网络信息资料审核表》中的相关内容,对统计网络信息质量要认真审核,经本单位负责人审核签字,重要信息须经局长审定同意。连同统计网络信息资料软盘及《*市统计局统计网络信息资料审核表》,报送计算站。

四、信息提供方式及时间要求

要求提供的统计网络信息资料必须是WORD、EXCEL或纯文本文档。

除领导明确批示不能上网的信息外,其它统计信息须在正式印发后三天内由上述相关处室提供给计算站进行加载并上传省统计局网络编辑部。

各处室提供的网络信息应以软盘或电子邮件的方式提供,邮件要求写明主题:如“**期统计资料”,并注明作者姓名及所在处室。邮件地址:*

计算站必须在各处室提供信息三天内对批准上网的信息进行加工、制作成网页,统一加载到市统计局内部信息网上,保证本局网站内容及时更新。

五、信息上报

各单位信息及时上报是办好统计信息内网,真正实现“信息共享”的基本前提。各单位务必加强组织领导,积极开展信息上报工作。市统计信息内网将增设“各单位统计网络信息上报与采用统计表”,定期在内网公布,作为*市统计信息内网开发应用工作的一项重要内容。

六、网络安全

统计网络信息仅限统计系统内部使用,各栏目信息资料的密级程度、是否上网,要严格按照《保密法》、《统计法》、《国家统计信息网保密管理暂行规定》的要求执行,确保网络信息的安全和保密。

各处室的计算机设备应安装并及时更新北信源防病毒软件。所有信息发送至邮箱之前,均应进行病毒检测,确保网络正常运行。

七、统计网络信息考核、评比制度

把统计网络信息的报送情况纳入年度工作考核的一项重要内容。由局统计信息化领导小组对各单位统计网络信息报送数量,局内部信息网、省局内部信息网、国家内部信息网采用信息情况,人员落实情况等作为主要考核、评比内容。

1、评比内容:

(1)信息量:各单位报送的各类信息。

(2)各单位按工作目标任务书规定的各类信息即时报送的,每一篇加2分,每缺一篇减3分。

(3)被局内网、省局内网、国家内网采用的信息,每采用一篇分别加1分、2分、3分。

(4)人员落实。(10分)

网络统计范文篇4

关键词:卫生统计;网络直报系统;现状;对策

卫生统计是卫生统计行政管理部门的基础性工作,早在2007年的下半年,我国就已经开始了卫生统计网络直报工作,并且在颁布实施的《国家卫生统计调查制度》中,就卫生统计调查的统计方法、调查内容、数据采集、指标解释以及指标口径等进行了规范,也使得卫生统计直报系统实现了对于各级医疗卫生机构的全面覆盖。卫生统计直报系统的应用,促进了统计效率的提高,也使得卫生信息的及时性和准确性得到了显著提升,改变了传统卫生统计的管理模式和服务模式,促进了卫生统计工作水平的提高。

1卫生统计网络直报系统的优势

一是信息报送的环节十分简单,借助网络直报系统,统计人员在对医院的卫生统计信息进行报送时,只需要登录国家卫生统计网络,在直报系统中将数据输入即可,不需要进行逐级申报,上级卫生机构就可以直观地看到卫生机构申报的信息;二是报送数据十分智能。统计人员在对卫生数据进行报送的过程中,需要就数据的客观性和准确性进行验证,看其是否符合基本逻辑,然后只需要点击合理化审计所有数据,在报表下方就会将错误的信息显示出来,智能化的系统能够显著提高人为发现错误信息的可能性,也可以有效节约统计人员以及上级审核人员的时间,降低工作难度;三是报送的数据非常及时。在网络直报系统中,采用的是月报、季报和年报层层递进的制度,能够在提高数据报送效率的同时,保证数据的及时传输,使得卫生管理部门能够准确把握医疗卫生动态以及卫生事业的发展情况,为决策的制定提供有效的参考依据。

2卫生统计网络直报系统的现状

2007年,卫生统计网络直报系统就已经开始正式运行,实现了对于各级各类医疗卫生机构的全面覆盖,统计人员可以通过网络直接登录相应的系统来对卫生统计数据进行填报,也可以借助离线工具进行数据填写,然后连接数据库服务器,将数据传输到系统中。卫生统计网络直报系统采集的数据信息类型众多,包括各级卫生医疗机构的基本信息、设施、人员、经费以及医疗服务等信息的年终汇总数据;在岗职工性别、年龄、学历、职称、所在科室等;医疗卫生机构大型医疗设备的数量、型号、单价以及使用状况等。借助相关信息,卫生行政管理机构能够了解辖区内卫生资源的配置情况,以及医疗服务利用率、质量状况等,为医疗改革的持续推进提供监测和评价,也能够为突发公共卫生事件的医疗救治组织提供基础信息。但是就目前来看,卫生统计网络直报系统中存在有不少缺陷和问题,影响了系统功能的充分发挥,需要得到足够的重视。2.1人员素质不高。卫生统计工作中,要求报表统计人员能够具备相应的统计学知识以及计算机操作能力。但是从目前来看,存在着统计人员素质参差不齐的情况,无法很好地对实际操作中遇到的各种问题进行有效解决。例如,在系统插件需要升级时,如果统计人员的计算机水平不高,则会影响升级的效果;若报表的逻辑关系不清,则会造成填表质量差,影响统计工作的顺利实施。另外,在统计队伍中还存在复合型人才严重欠缺的情况,使得卫生统计数据的准确性和时效性无法保障。2.2系统功能欠缺。在卫生统计网络直报系统中,采用的是全国统一的填报标准,并不能很好地适应不同地区的不同情况,需要通过频繁的升级来进行修订,这样不仅增加了管理人员的工作量,也容易引发数据填报错误的问题。另外,系统在数据分析中,一般都是从卫计委的角度出发,分析模块欠缺灵活性,影响了业务人员的查询和分析。同时,部分报告支持的格式单一,导致统计人员在进行病历导入的过程中,经常会遇到死机、进程停滞等问题,影响了数据上报的成功率。2.3统计方法落后。现阶段,基层卫生医疗机构因为基础设施落后、统计方法单一等因素,导致不少统计工作需要人工完成,例如,部分医院的门诊人次和出入院人次需要人工统计,消耗大量人力物力资源的同时,也影响了数据统计分析的效率。同时,落后的统计方法还会引发数据丢失、数据失真等问题,这些问题的存在严重影响了数据填报的准确性,也在一定程度上阻碍了直报系统功能的有效发挥,需要工作人员充分重视起来,对问题进行解决。2.4数据不够全面。新时期,伴随着我国医疗保障制度和公共卫生体系的优化,统计人员理解统计指标的难度大大增加,想要准确把握统一的指标含义及标准,对于统计人员的专业素质和能力有着严格要求。以每千人口床位这一指标为例,统计人员对于开放床位的理解不同,上报的数据也会有所不同,这样就引发了数据偏差的情况。不仅如此,网络直报数据也存在一定的质量问题,包括数据虚假、数据真实性不高、指标数值背离指标原意、数据逻辑性错误等,这些问题的存在都会影响数据的准确性和全面性。

3卫生统计网络直报系统的强化对策

3.1提高思想认识。从整体层面分析,部分基层医疗单位如乡镇卫生院、社区卫生服务中心等对于卫生统计工作的重视不够,无论是领导还是统计人员,都存在信息化意识薄弱的问题。因此,在实际工作中,基层医疗单位应该提高思想认识,强化单位领导以及统计人员的卫生统计信息化意识,确保信息化意识能够实现有效的贯彻落实,同时,政府部门以及上级管理部门应该为卫生统计信息直报工作提供全方位的支持,包括资金支持、人员支持等,因为想要对卫生统计网络直报系统的数据库进行拓展,增加系统功能,必须投入大量的经费作为保障。各级卫生机构应该及时转变自身的观念和认识,加强学习,确保领导和统计人员都能够认识到直报系统在推动医疗卫生事业发展中的重要性。3.2强化队伍建设。医疗机构应该重视对于直报人员队伍的建设工作,采取有效措施来提高人员素质,选择具备专业统计知识和计算机操作相关知识,熟悉统计政策的人员参与统计工作,同时也需要做好卫生统计指标的筛选,确保其能够将区域的卫生工作情况准确反映出来。一个合格的统计人员,需要同时具备卫生统计学知识、临床医学知识、卫生经济知识以及现代管理学知识等,这样才能保证填报数据的准确性。新的发展环境下,网络直报技术的应用,使得统计频率和报告项目迅速增加,统计人员的工作量也越来越大,其必须具备丰富的统计业务知识储备以及良好的计算机操作能力,在条件允许的情况下,还应该设置专门的统计岗位。不仅如此,医疗机构应该鼓励统计人员参与相应的培训工作,针对统计人员的统计业务以及计算机操作水平进行培训和考核,确保统计人员能够熟练进行各种表格的填报,做好统计信息资源的深入挖掘和整理,从庞大的数据库中,提炼出所需数据,把握好关键信息,并且提出有效的改进建议,确保统计工作的顺利实施。3.3改善统计方法。现阶段,在卫生统计网络直报系统中,依然存在有统计方法陈旧单一的问题,要求医疗机构能够结合自身的实际情况,切实做好统计方法的改善和创新。对于统计管理部门而言,想要掌握更加完善、更加准确的数据信息,需要对下级部门提供的统计数据进行整理,如果统计方法不合理,在工作中可能会出现滥发报表,或者数据混乱的情况,影响统计工作的实施效果。对此,医疗机构应该对统计制度进行完善,做好统计方法的优化和创新,以更加先进、更加多样化的统计方法来提高统计数据的准确性,减少统计过程中的数据失真问题,切实保障统计工作的效果,为直报系统提供更加可靠的数据信息。3.4优化直报系统。考虑到卫生统计网络直报系统涉及的基层单位以及用户较多,统计管理部门需要对直报系统进行优化和完善,进一步加强网络直报建设工作。统计人员应该使用高配置、高性能的服务器,对网络带宽进行拓展,提高数据传输能力以及网络上报速度,做好数据处理工作。医疗卫生机构应该从自身的实际情况出发,做好网络直报系统的硬件建设,优化系统部署,同时也应该做好直报信息的数据审核,确保信息数据的准确性和有效性,对基础数据进行有效监控,对于发现的异常情况,则必须及时进行处理。另外,应该开放数据分析功能,确保系统管理人员能够在后台完成公式编纂、维度定义等工作,业务人员借助相应的数据模板,可以对各种数据进行计算,搭配图形、曲线等将数据直观的展示出来,为数据信息的查询和展现提供便利。3.5引入信息技术。信息化时代背景下,相关部门需要切实做好卫生统计信息化建设工作,对统计过程进行完善的同时,保证统计数据的准确性。结合新的国家卫生统计调查制度分析,各项指标都开始朝着更加细化、报送频率更快的趋势发展,传统的手工统计无法很好地满足国家调查制度的需要,医疗机构中的很多数据指标都需要从医院信息系统中获取。基于此,医疗机构需要高度重视信息化建设,从源头上保证统计数据的质量,统计人员应该借助网络平台,与系统工程人员进行沟通和交流,定期完善和优化系统各个功能模块,提高网络直报的速度,推动卫生统计资源的高度共享。3.6做好数据审核。各级医疗卫生机构应该将统计工作列入议事日程中,推动年终目标考核的有效落实,同时加强领导,成立专门的组织机构,为统计人员提供必要的工作条件。应该依照相关要求,制定出明确而具体的调查制度以及相应的基层卫生统计规范,就指标解释、调查制度、系统操作以及数据质量控制方法等进行培训,对数据原始表以及汇总分析表进行全面审核。另外,医疗卫生机构需要做好细致分工,推动管理制度的优化和完善,必要时应该成立相应的领导小组,将主管领导、财务部门、医务部门和设备科室负责人全部纳入小组中,确保各部门之间能够实现相互配合,共同完成机构的直报工作。

4结语

总而言之,卫生统计工作在卫生信息化过程中发挥着至关重要的作用,借助稳定而成熟的卫生统计网络直报系统,能够对卫生统计工作的准确性和时效性进行解决,而领导的高度重视能够为统计工作的顺利实施提供良好支撑。从医疗卫生机构的角度,应该做好卫生统计网络直报系统发展现状的深入分析,明确问题的原因所在,采取切实可行的措施和方法来对问题进行解决,提升卫生统计网络直报系统的运行效果。

参考文献

[1]黄会青,肖莉,李秀珍,等.江西省联网血费即时直报系统全覆盖情况调查分析[J].中国输血杂志,2019,32(12):1268-1270.

[2]魏争,朱永海,张辉,等.西安市高陵区学校因病缺课症状监测信息直报系统数据报告质量调查[J].医学动物防制,2019,35(12):1135-1138.

[3]乐淑萍,周俐.血液费用直接报销系统应用研究[J].中国输血杂志,2019,32(01):78-80.

[4]梅岚,王莉红.网络信息化直报系统在护理不良事件管理的应用效果[J].实用医技杂志,2018,25(05):562-563.

网络统计范文篇5

各乡镇人民政府(街道办事处),县级各部门,有关单位:

为更好地服务于全县经济社会发展,按照市人民政府《关于加强全市统计基础工作的意见》(渝府发〔〕72号)和市统计局、国家统计局调查总队《关于建立健全全市统计调查网络的通知》(渝统发〔〕50号)要求,现就加强我县统计调查网络建设工作通知如下。

一、充分认识统计调查网络建设的重要性。统计是各级党委、政府科学决策和管理的重要基础工作。统计调查网络是整个统计工作的根基,是做好统计工作的前提。只有加强统计调查网络建设工作,确保源头数据质量,统计才能真正有效地为县委、县政府科学决策提供依据,为社会公众提供信息和咨询服务。各乡镇(街道)、有关部门和企事业单位要进一步加强对统计工作的组织领导,把统计调查网络建设作为加强统计工作的一项基本要求,为统计工作的顺利开展和确保统计数据质量提供有效保障。

二、建立完善以县为总体的统计调查网络。为客观真实反映我县在落实科学发展观、推进民生工程和“五个”建设的水平和进程,满足地区生产总值核算和有关考核需要,按照市统计局和国家统计局调查总队的统一部署,结合我县实际,从年底至年上年,全面启动、建立和完善规模以下工业、限额以下批零住宿餐业、城镇居民收入、农民收入、私营企业劳动工资、资质以外建筑企业、服务业、农产品产量、农产品中间消耗、畜禽(生猪大县监测)监测、流通消费价格、工业品价格、投资价格、房地产价格、农户万元增收等以县为总体的统计调查网络。

三、切实保障统计调查网络健康运行。全县统计调查网络建设由县统计局组织领导,管理协调和业务指导由县统计局、国家统计局调查队按照网络建设的业务分工要求具体组织实施。县发改委、县经信委、县农委、县城乡建委、县商务局、县国土房管局、工业园区等部门要结合职能密切配合统计部门做好全县统计调查网络建设工作,有关乡镇(街道)要结合任务要求认真组织落实。各抽中机关、企事业单位要充实配备统计人员,履行统计义务,依法、及时、完整向县统计局和国家统计局调查队报送相关数据。凡不按规定履行统计义务或弄虚作假的,由统计部门依法处理。县财政局要将统计调查网络建设的配套经费纳入财政预算,足额安排,改善统计工作条件,保障统计调查网络的正常运行。各部门、乡镇(街道)要按照分级负担的原则,切实安排好调查网点建设必要的经费。相关企事业单位在开展统计调查时,要满足必要的工作开支。

网络统计范文篇6

访问量的多少是衡量网站是否成功的重要标准,但对于图书馆网站是远远不够的,图书馆需要获取完整的读者访问流量统计数据,来对图书馆信息资源的使用情况进行分析,网络信息计量学方法是目前网络界普遍采用的网站绩效评估计量法,被认为是可以用科学的方法检验网站访问数据的一种工具。它的目的包括了解网络读者的行为、确定网站是否吸引适当的读者来访、评定网站建设策略是否得当。其实施步骤可分为三个阶段:

(1)记录网站的访问数据;

(2)分析记录数据;

(3)为网站建设策略的改进提供依据。

2.1系统原理

由于网络站点和数据库本身具备了访问计量功能,各自的信息资源收藏状况便于人们掌握,并且能自动记录读者访问的登录情况,如登录名、登录时间、浏览文件、读者的来源地址等,这些数据资料能够准确反映读者访问信息和来源分布等情况,所以依据图书馆网络读者访问统计的工作内容,制定相应的分析指标,并收集网络读者访问图书馆信息资源站点形成的日志文件,然后利用日志统计工作软件定时对日志文件进行处理,得到统计数据,并动态生成各种表达形式的能满足图书馆各项统计分析工作的报表。最后把生成的分析报表导入到数据库中出去。

图书馆各个网络资源站点建设人员可通过浏览网络读者访问流量统计分析报告,分析和了解读者的访问需求,从而做好网络信息资源的建设工作。

读者行为分析研究则可通过对分析报告进行质化研究,并结合一般调查法、咨询研究法对读者的信息寻求行为进行研究。

本系统还可利用统计分析的结果来对系统自身工作进行评估和调整。

2.2分析指标

传统图书馆的分析指标和计量方法,虽然和数字化图书馆有很多不同,但使用的目的及计量的准则并没有太大实质性差异[4]。

参考传统图书馆的分析指标以及国内外类似的研究结果选定了下列10个分析指标:

(1)读者到访人数和潜在读者人数的百分比;

(2)到访读者表现了阅读的兴趣的百分比(采取明显的阅读行动);

(3)可能的读者转为经常的读者的百分比(经常阅读、下载资料);

(4)读者的持续度(重复到访读者);

(5)读者的忠诚度(网页浏览次数、再度到访的次数及时间长度);

(6)读者停止阅读行为的百分比(阅读行为半途中止);

(7)读者耗损率(现有读者中停止阅读行为者的百分比);

(8)读者动摇率(耗损的读者/到访读者的总数);

(9)读者最近到访时间(据上次到访的间隔时间);

(10)读者到访频率(多久到访一次)。

就此参数,我们可以从一个客观的角度来观察和评估图书馆网络读者访问情况。

1.3系统框图

网络读者流量统计分析系统功能框图

1.4工作方法

本系统工作方法主要是采集网络读者访问过程日志进行量化分析法,它的优缺点见表1。

读者访问过程日志分析法优缺点

量化分析法重视量的分析,本系统通过对访问过程日志以量的方法加以统计分析,首先根据为了研究读者需求分布和需求增长情况这一目的将研究内容归类成若干分析单元,接着将分析单元以数量的方式加以表达,进而以此为解释读者信息寻求行为的依据。

1.5技术实现

(1)系统结构

本系统是以浏览器/服务器/数据库体系结构作为基本架构,通过ASP方式实现交互式、动态的读者访问日志统计分析系统。系统结构框架如图2所示:

读者访问日志统计分析系统结构框图

(2)系统组成模块

本系统有六个模块组成:访问日志入库、访问流量分析、被访页面分析、来访读者分析和统计分析图表。

(3)系统运行环境与开发平台

本系统运行环境和开发平台如表2。

Excel2000

(4)程序流程与代码实现

该系统由main.asp(主界面程序)、flux.asp(小时、日、星期流量分析)、target.asp(被访页面分析)、visitor.asp(来访读者分析)、chart.asp(统计分析图表)五个组成。

我们以“被访页面分析”模块的程序流程和代码说明系统组成模块的实现过程,该模块程序流程图如图4。

“被访页面分析”程序流程图

相应代码:

<table

<tdclass=定义的表格形式及表头>

Setconn=server.creatobjectl("adodb.connection")

conn.open"dsn=dsn_dbs;uid=xxx;pwd=xxx"

Setre=server.creatobject("adodb.recorderset")

re.activeconnection=conn

dbname=Application("logtime")——数据表名称

re.open“QL语句”

dowhilenotre.eof

执行Recordset操作,服务器进行统计计算

response.write——写入统计表

re.movenext

loop

re.close

程序中一些代码说明:

①Recordset的Open方法:允许用户向数据库发出请求,通常是运行sql命令。如:Sqlquery="selectlogtimefromintemetlogwhereday(logtime)=day(getdate())andmonth(logtime)=month(getdate())andyear(logtime)=year(getdate())"Dbrs.opensqlquery,dbconnection,3,3

②Recordset的RecordCount属性:可以取得当前在Recordset对象中的记录条数。如:setdbrs=server.createobject("ADODB.recordset")amount=dbrs.recordcount

③Recordset的MoveNext方法:移动指针到Recordset对象的下一条数据。如:Dbrs.movenext

④Response的Write方法:负责将字符串信息输出的用户端。如:Response.write“页面总访问量:“&amount&”<br>

⑤Recordset的Close方法:可以用来关闭指定的Recordset对象。如:Dbrs.close

2.6系统运行过程

下面以西安交通大学图书馆网站为统计分析对象说明该系统运行过程。

首先我们用FTP工具抓取网址为的服务器,时间段为2003/01/01到2003/12/31的访问日志导入到数据库中,该服务器完成图书馆网站的部分功能:门户信息、OPAC、馆际互借、电子期刊、网络数据库、网络资源、参考服务等。

对日志分析系统进行运行参数设置:读者访问时间间隔设为20分钟;从最新QQ显IP版软件中导出读者IP地址分配资料,转换格式后导入到日志分析系统的地址表中,以便对读者分群;设置过滤规格文件滤掉一些无用的访问信息,如背景图片、图书馆Logo,页面美化图片和服务器漏洞扫描日志等日志信息,然后对服务器访问日志进行初步统计分析,保存统计分析结果准备进行进一步统计分析。

最后利用精致多样的统计分析方法对初步统计结果进行统计分析,统计分析出的数据有:一年内资源点击与访问计数;一年内网站中最常使用的资源与服务;一年内点击次数最多的读者;一年内务分群读者的点击次数比例;一年内点击次数与阅读次数的变化;一年内上网的读者与累积成长趋势;一周各天的平均点击次数;一天内各时段的平均点击次数;校内各区读者点击次数比例;各项相关资源被使用的情形等等。这些数据可用Eexel软件生成直观的统计分析图表,部分图表详见实际应用一节中。本系统的研究主要采用访问过程日志分析法,以内容分析法、问卷调查法辅助研究。主要考虑:一是这种方法在电子商务和其它网络应用的量化分析,已经有许多研究成果,可使我们的研究更为便利;二是可以经济的,较具体客观的分析到网络读者信息需求特性;三是通过定量的计算,定质的分析,形成一种综合分析的方式,以求分析结果更为客观和科学。

3实际应用

从2002年开始,我们从图书馆门户网站读者访问计数开始了网络读者访问统计工作,从最初的图书馆首页访问计数到现在应用网络读者访问流量统计分析系统到以信息资源站点、数据库为单元的访问利用上,取得了不少研究成果,下面我们介绍以2003年西安交通大学图书馆网站读者访问日志为统计对象,获得的一些统计分析结果。

表3是2003年图书馆网站的资源浏览次数,访问次数与访问读者数的统计表,我们看到一年内资源的浏览次数是10,222,296,访问次数是1,617,166,访问读者是310,628,对照2003年西安交大统计公报教职工5341人,在校学生32766人的数据表明图书馆网站有很高的访问量。另外网络访问读者310,628远远大于学生和教职工的总和,表明有相当多的读者使用本馆的资源,这说明本馆的信息资源丰富,吸引了很多读者。网站不足之处是自建的外文资源很少。从表3看,来自国内访问占6.43%,来自国外访问占0.01%。综合以上资料,西安交大图书馆网站为校内外读者提供了方便、丰富的资源服务,吸引了大量的读者,但在国外的知名度很低,现有资源不能吸引国外读者,对此图书馆采取一些措施,来解决这个问题。

①建设网站的英文版本;

②把本校和本地一些有特色的文化资源数字化后,做成中英文全文数据库。如钱学森多媒体数据库、江南制造局多媒体数据库;

③参与中外数据库合作建设项目,如中美百万图书项目。

单一访问者数310,628

接着我们看一年间网络读者常使用的网站资源与服务,图5显示的是读者最常使用的前十项网站资源与服务以及它们占全部浏览次数的百分比。从图中我们观察到前十项占了访问量的43%,第一项是图书馆首页,然后依次是网络数据库、联机公共目录查询、中国期刊网……,这说明图书馆网站的资源内容设计与规划合理,读者访问资源方便,相关信息更新及时,受到了读者的欢迎。另外,网络数据库和联机公共目录访问比例接近说明读者并重利用印刷型资源和数宇化资源,数字化资源对科研和教学的作用日益明显。从图5中我们还观察到所有的电子数据库访问所占比例值呈现出指数下降的趋势,这说明较少数数据库的访问量较大,而较多数数据库访问量较少,根据这个特点,图书馆在采购数据库时可采取不同的采购策略,对于使用量大的数据库保证数据的更新量和连续性,则可满足约80%的读者信息需求,对于较多的使用量少的数据库可采用合伙采购共同使用的办法,来满足约20%的读者信息需求。

图书馆网站前十名资源与服务以及它们占全部访问次数的比例(01/01/2003-12/31/2003)

接下来我们来分析常访问的读者及其来源,首先,图6中表示网络读者访问次数的分布,从图6中可以看出75.15%的读者只访问过一次,9.86%的读者访问过两次,6.49%的读者则经常访问图书馆网站,这说明作为一个为大学教育和科研服务的信息中心,图书馆的网络资源已经有了固定的读者,但还有大量读者的信息需求不能满足,为此图书馆通过参加一些文献信息资源建设项目和组织,如中国高等教育文献保障体系(CALIS),陕西省科技情报协作网等,以便获取更多优质的文献信息资源,增强图书馆文献信息资源的保障能力。另外,图书馆信息资源大多数有访问权的限制,校外的读者无法接触到,为此图书馆采取了一些办法,如建立电子数据库导航库,电子期刊导航库,提供文献传递等服务来满足校外读者的信息需求。表4是常来图书馆网站的读者统计数据,可以观察到前二十名读者绝大部分是西安交大校园网的读者占全部来访数的4.61%。如果以其上网所属机构来划分来访的网络读者,图7是前十名各类机构网络读者的访问。从图7中,我们可以清楚的看到本校的用户占73%,其中来自科学馆的访问占3.23%,图书馆的读者占3.18%,西一楼的2.34%,可见西安交大的校园网比较普及,读者能够很方便的进入图书馆资源网站,这也表示图书馆提供给读者阅读电子资源的电子阅览室满足了读者需要。在图7中数据显示,外校的读者也经常访问图书馆网站,如西安理工大学的读者占0.33%,长安大学的占0.31%,北京大学的占0.05%,西北工业大学的占0.17%,上海交大占0.08%等等,这些读者主要使用联机公共目录查询和使用自建数据库,这说明高校间的信息共享正在发展,图书馆应该加强自建特色数据库的建设,增强文献传递和馆际互借服务,满足这些读者的信息需求。

接下来我们来观察各类读者在每个月访问网络资源的比例变化图,见图8是各类网络读者访问前十名网络资源的变化图,总体访问变化的趋势和学校的校历安排有明显的关系,每个数据库的访问量变化则和各类读者的信息需求不同有关系。这反映了读者的结构影响着网站的使用情形。

网络读者访问图书馆网站次数分布(01/01/2003-12/31/2003)

前十名各类主机访问图书馆网站的访问次数(01/01/2003-12/31/2003)

各类网络读者对前十名网络资源访问变化图(01/01/2003-12/31/2003)

由于篇幅有限,我们简单介绍了本系统对图书馆网站网络读者访问流量的统计分析结果,在以上的讨论中,可以观察到读者利用网络信息资源是联机公共目录检索和信息检索并重,且大部分读者是本校的。

通过上述讨论,我们知道本系统还有许多值得进一步研究之处,下一步的研究方向是收集更完整的读者访问日志,包括更长期的和所有与图书馆资源访问相关的。并且尝试利用精致的统计方法来分析,以达到对网络读者行为更精确的解读。

4结语

经实际应用证明,该系统对我馆信息资源建设起到了重要的促进作用。首先,在控制我馆信息资源存放空间问题上,虽然目前看来效果不明显,但如果越来越多的信息资源杂乱无章地占据信息空间,将会大大降低信息检索的效率,干扰核心信息源的利用。本系统可以提供调整信息存放的定量依据,在探明各类型信息资料数量特征的基础上,分析其增长和老化规律,判断信息的价值和时效性,使有价值的信息充分地发挥作用,使信息空间得到有效的利用。

其次,在“以人为本”的理念指导下,图书馆走出了单纯提供馆藏信息资源为中心的定位,着眼于满足读者广泛的信息需求。在本系统的指导下能实现这个目标:一是根据信息资源规律反映出的学术动态和信息利用规律反映出的需求动态,指导图书馆的馆藏资源建设。二是通过对信息资源利用规律的研究,使计算机信息检索系统走向科学化、规范化,从而方便用户查询。

在整个研究过程中,取得了一些研究成果,也发现有不少问题等待我们进一步的研究,首先是无法取得确实充分的数据,主要问题是图书馆提供的网络数据库是联接到厂商的数据库中去检索的。如果图书馆自己没有服务主机,那么就要请厂商提供访问数据,虽然厂商都会提供月报表,但是能够判读的资料不多,或是他提供的数据不标准,或是他提供资料不是图书馆想要的。其次不易解释数据,有了访问过程记录数据,可是怎么去解释它?读者从哪里来,做什么,这个比较容易解释,可是要知道读者做某件事的动机,就没有办法从数据中去解释了。

【参考文献】

1WonsikShim,CharlesR.McClure,JohnCarloBertot&JamesT.Sweet.ARLE—MetricsProject:DevelopingStatisticsandPerformanceMeasurestoDescribeElectronicInformationServicesandResourcesforARLLibraries:PhaseOneReportTallahassee,FL:InformationUseManagementandPolicyInstitutc,SchooloflnformationStudies,2000./stats/newmeas/emetrics/phaseone.pdf(AccessedSep.10.2001)

2詹丽萍.E-metrics在数字图书馆使用评估的应用.数字图书馆与数字博物馆趋势研讨会,2001:21-30

3邹菲.试论网络信息计量学在数字图书馆中的应用.图书情报知识,2001(1):16-20

网络统计范文篇7

关键词:统计;调查;网络调查

1网上统计调查的问题与解决方案

网上统计调查虽然方便、快捷,但还存在着一些不尽完善、科学和规范的地方。从统计的角度来看,其调查对象不确定、调查方法不严谨等问题是导致其调查结果的真实性、科学性、代表性难以保证的直接原因。网络调查潜在危险是,日益增多的调查越来越良莠不齐,人们也难以区分好的调查与不好的调查。网络调查的价值也受到人们填答意愿的限制。因此在类似调查的狂轰滥炸下,人们可能干脆不理睬,也可能根据其内容、主题、娱乐性或者调查的其他特性而做出参与调查的决定。我们已经看到了这种过度调查的负面效应,这种过度的商业性调查已经威胁到了以此种方法进行民意调查的可行性。目前可采用以下13种科学方法来保证网络调查的科学性。

(1)抽样方法。根据您的需要,在样本库中进行随机抽样、分层抽样、抽样保护、科学配额等操作,让您轻松挑选出符合调查需要的、符合科学规律的样本。

(2)唯一性判别。保证只有被邀请的人才可以填写问卷,而且只能填写一次。

(3)每题单屏显示。被访者填写问卷时,每一题目都是单屏出示给受访者,使其不会被前后的问题和选项所干扰,从而影响调查数据收集的质量。

(4)题目和选项循环交替。题目出现的先后顺序和选项排列的先后顺序循环变化,避免因问卷问题的顺序和每题选项的顺序的固定而使调查数据出现偏差。

(5)逻辑跳答。根据前一题受访者不同的回答,在本题出示不同的题目,可以更真实地体现受访者的真实想法,大大缩短了每个被访者看到的问卷长度,从而避免冗长的问卷对调查数据的影响。

(6)逻辑判断。根据预先设定好的技术锁,实时判断受访者的答题是否符合规范,并且立刻要求不符合规范的进行更正,重新回答该题。这一措施有效避免了问卷后续处理中错误问卷、编码、数据录入所产生的人为错误。

(7)帮助提示。每题可以提供“帮助”,使受访者可以更好地了解题目意图,有效避免传统调查因访问员理解、传达题意、甚至作弊而对调查数据造成的致命影响。

(8)图片展示。每题可以提供图片和说明文字,问卷可以图文并茂。

(9)实时监控。我们深知,调查数据的质量是在调查过程形成的,所以在调查进行期间,可以方便、灵活地随时进行调查质量的监控和修正。

(10)客户化的问卷。所有问卷都经过了客户化的处理,启用这一功能后,受访者参加调查时,看到的是客户公司的Logo等,可以让受访者明确感到自己是在参加客户公司举行的调查。

(11)人性化界面设计。为被访者创造一个被访问的环境,使其有一种在接受访问的感觉。

(12)科学的题型配置。题型包括:单项选择、多项选择、问答题、数字型题、可归类的开放题、重要性排序题、比例题等等。

(13)方便的客户PANNEL接口。这一功能,使您可以方便地利用您自己的PANNEL,对您自己的客户进行调查,以避免样本选择出现的偏差。

2提高网上调查回收率

2.1要遵循网络规范和文化准则

网上调查必须执行网络规范和文化准则,对互联网用户应该坦诚、不打扰和尊重;遵守有关互联网络的各项法规、条例;严禁有关政治、色情等违法信息,否则你要承担由你直接或间接引起的刑事或民事法律责任;互相尊重、讲文明、讲道德。特别是在讨论组中进行调查,要注意网上行为的规范,调查的内容与讨论组主题相关。如果不遵循网络规范和文化准则,就会引起应答者的反感,降低问卷的回收率。

2.2尊重个人隐私

在近几年中,随着互联网的飞速发展,个人在互联网上的隐私权也越来越受到广泛的关注。为了获得更高的回收率和防止不信任,在网上收集和使用个人资料时应遵守以下原则:

(1)公开信息收集的目的。

(2)说明采取什么方法保护个人资料隐私,保证资料的质量和完整性。

(3)说明提供或不提供信息的结果。

(4)说明滥用个人资料时用户享有的索赔权。

(5)向应答者介绍隐私保护政策。为了尽量在人们不反感的情况下获取足够的信息,在线调查应尽可能避免调查最感的资料,如住址、家庭电话、身份证号码等。

2.3进行不扰民的问卷调查

使用大量电子邮件名录发送问卷或邀请参加调查的请帖,容易让人生厌,应该经常给应答者退出邮件名录的机会。选择调查样本时,应该交叉检查邮件名录以免向同一电子邮件发送重复的邮件,避免轰炸式发送电子邮件。因为不经应答者的允许就发给调查表是一种侵犯隐私权的冒失行为。

2.4对问卷进行个性化设计

网上调查的问卷的设计者在沟通技巧上,从应答者角度出发,调查问题能引起应答者的共鸣;在问卷设计语言上,避免专业化倾向,增加回答的难度。对应答者的尊敬也可以通过问卷的个性化设计来体现。让应答者对设计问卷提出意见,进行修改,或自己设计问卷。问卷调查的字体、颜色、背景完全个性化定制。还应给出填写问卷的明确另面视前一篇情况可加可不加指示和退出调查的指导。

2.5问卷设计科学合理

首先在提出问题之前说明调查的目的、意义等,主要目的是为了引起应答者的重视和兴趣,争取他们的积极支持与合作。在确定调查目标的基础上,充分考虑应答者的特征及心理特点,然后提出问题。设计完美的问卷,问句应简

洁易懂,定义清楚,尽量采用选择答案式,敏感的问题应该婉转迂回的提出,不要让应答者反感。问卷的结构安排要先易后难、先熟悉后陌生、先客观后主观。在问卷的最后应有一段结束语,对填表者表示感谢。精心设计的问卷设有一个消除键,调查对象按消除键可以改变答案。

2.6设计合理的问卷长度

在网上调查时,问的问题越多,访问者就越不愿意参与。为了提高回收率,网上问卷调查应该保持简短(一或两屏)。短问卷既能帮助用户省钱又能博得用户的好感。由于在线调查需要访问者填写在线表单,因此,相对于一般问卷调查来说,更应该具备简洁明了的特点,尽可能少占用填写表单的时间和上网费用(如果一份问卷需要10分钟以上的时间,相信多数人没有这种耐心)避免被访问者产生抵触情绪而拒绝填写或者敷衍了事。如果问卷很长,不妨分为几段,每段包含几个问题,应答者可依据自己的时间和兴趣逐步完成。最重要的问题放在每个段落的前面,就算调查对象来不及回答所有的问题,至少最重要的信息已经收集到手。公务员之家

2.7采取奖励措施

由于网上调查需要占用用户的时间和上网费用,因此,作为补偿或者激励参与者的积极性,问卷调查者一般都会提供一定的奖励措施,提供奖励可以提高回收率。奖励可以是物质的,也可以是非物质的,而且确实能够提高用户的参与程度和完成问卷的积极性。现金奖励可用于大多数问卷调查;免费的屏幕保护程序和其他软件通常可用刺激计算机老手和计算机行业的人;如果企业需要了解顾客的更多信息,赠送产品策略就特别有效。还有一种让应答者参与问卷调查的强有力方法——非物质奖励。例如,参加调查的人可以获得一份电子业务通讯,可以免费看阅电子期刊、书籍或报纸。因为大多数情况下,人们把自己的参与看成是对知识的贡献以及了解网上世界的一种方式。公务员之家

3网络调查的优越性

网络调查改变了传统的统计调查模式。传统的统计调查,从直接观察、面访,到布置调查表登记上报等各种调查方式,耗用大量人力、物力。网络调查则为统计调查提供了现代化的便捷的调查方式,今后除普查中登门人户登记外,其余均可采用网络调查,从而改变传统的统计调查模式。

同时,网络调查不受时间和地域限制。网络通讯没有时间限制,全天24小时运行.网络覆盖面广阔,面向全国各行各业、全球各个国家和地区,使网络调查能够随时随地进行。样本的确定也不受地区限制和调查人数、户数的限制,可通过适当扩大样本容量来提高样本的代表性,减少抽样误差。除了实测等调查外,一般调查均可在网络上完成,大大缩短了调查时同,保证了调查的时效性。

网络统计范文篇8

关键词:跨国经营核心竞争力

随着社会经济的发展,人们对于统计信息的需求日益增强。统计信息化建设的不断加快,为更多用户通过网络获取统计信息提供了便利条件。统计信息产品作为一种劳动的结晶,具有价值和使用价值,具备了一般商品的性质。因此,笔者认为,可以借助电子商务的经营模式进行统计信息产品的交易来更好地满足人们对统计信息的需求。本文就统计信息产品在电子商务化过程中所涉及的问题作些讨论。

统计信息产品的界定

根据国家统计局、国家工商行政管理局颁发的《统计信息咨询服务管理暂行规定》中规定:统计信息是指运用统计方法所取得的以数据形式反映社会、经济、科技情况的各种统计资料,包括以书面文字、磁带、磁盘等物理介质为载体的数据汇总资料及据此进行分析研究提出的咨询意见和对策建议。但对于什么是统计信息产品,却没有明确的定义,只是在湖南省统计局制定的《湖南省统计局统计产品管理制度》中提出了统计产品的概念和范围,此规定中指出统计产品是指在统计调查、统计整理、统计分析、资料编辑、数据库建设、网页制作、统计信息等统计活动中形成的各种统计成果,主要形式包括统计报表数据、加工整理或编印成册的统计资料和书籍、统计分析资料和报告等。笔者认为,这里所说的统计产品就可以理解为统计信息产品。统计信息产品从形态上可分为两类,即无形产品和有形产品,无形产品主要是指存储计算机中提供下载和浏览的统计信息产品,而有形产品是指各种存储在磁盘、磁带、光盘等存储介质中的一切成型的数据或者信息产品,也包括各种纸质的各类统计产品。

统计信息产品电子商务化交易模式

一般商品的电子商务交易模式主要有4种方式,即企业对企业(B2B)、企业对政府(B2G)、企业对消费者(B2C)以及消费者对消费者(C2C)。参与统计信息产品的交易市场主体主要有:政府(G)、企业(B)和消费者(C),由于统计信息产品需求者和信息供给者的不同,因此它可能的交易模式及实现途径:

B2G,是企业与政府之间交易的一种模式。各级政府中的统计部门拥有大量的统计数据,这些数据的所有者应该是大众。但由于各种原因,目前大量的数据依然为政府所有。因此实现这种交易模式可取的途径是政府提供数据并委托专门从事统计信息处理和分析的公司进行科学的处理和分析,并为政府决策提供必要的信息支持,这种模式可以通过政府招投标的方式实现。

B2B,是企业与企业之间进行统计信息产品交易的模式。其交易途径应该是专业的统计数据分析和处理公司,接受委托或者自主开发面向特定企业或者行业的统计信息产品,以收取处理费用或者销售产品的方式实现自己的价值。

B2C,是企业对消费者的交易模式。这种模式类似与B2B,唯一不同的是面向的对象是一般的统计信息产品需求者。

C2C,是消费者与消费者之间的交易。这种模式的活跃程度很高,交易的统计信息产品的价格是由市场决定的。

C2B,是消费者对企业的交易。这种模式可以是专业人士接受委托或者自行研究推出的适合于某企业或者行业的统计信息产品,以收取委托单位费用或者自行销售实现价值和使用价值。

C2G,是消费者对政府的交易行为。这种模式类似与B2G,唯一不同的是专业人士与专业公司的区别,这种模式比较少见,但作为一种模式也是存在的。

统计信息产品电子商务交易平台

统计信息产品的电子商务化要借助网站才能得以更好的进行。统计信息产品的交易平台可以有三种方式:第一是政府(主要指各级统计部门)通过政府网站进行有关的交易,第二是企业自身建立统计信息产品交易网站,第三是个人通过自己建立网站或者借助他人的网站进行统计信息产品的加工和销售。在平台建设方面和推广中,需要考虑以下问题:

网站功能设计问题。在网站建设中首先考虑的就是网站功能,统计信息产品交易网站,应该包括产品的检索和展示,增值服务业务,产品采购管理,订单支付,客户服务和系统管理。在产品的检索和展示模块中,应将统计信息产品按照一定的标准(比如行业)分类,以便访问者检索,也可以将重要的或者比较成功的产品进行展示和介绍,吸引访问者的眼球。在增值服务业务方面,可以通过网站接受单位和个人的委托,专门对委托者提供的数据进行处理,形成产品并交付委托者的一种增值服务形式,这将是统计信息产品商务交易发展很有发展潜力的形式。设置产品采购管理模块,可以帮助信息需求者通过检索和浏览对网站提供的产品进行采购,包括有形产品的采购和无形产品的采购。定单支付管理是网站必不可少的一个功能,它对客户的定单进行及时、准确、有效的管理,并根据定单完成产品的生产和服务的提供。根据定单和所提供的产品和服务,实现交易支付过程。客户服务模块是为客户提供各种服务,这些服务包括咨询服务、售后服务以及免费提供各种信息等。系统管理模块是网站系统得以正常运行的必备功能,具体包括统计信息产品网站的产品更新、系统维护和升级等,又可分为前台管理和后台管理两个方面。前台主要是面向顾客,顾客通过前台页面完成对统计信息产品的采购,而后台主要有系统维护和数据更新等功能,同时还有网站服务器等硬件系统。

网站营销策略。网站营销是网站得以生存和发展的一个很重要的因素,同时也是经营产品销售宣传的必要措施。网站营销的方式很多,但对于统计信息网站的营销策略的选择可以重点从两个角度去考虑:一是顾客群的选择,由于统计信息产品具有一定的专业性,一般都是一些决策者和研究者,所以网站营销应该面向政府、企业和一些研究者;二是可以选择可靠的ISP以提供稳定安全的技术服务,还可以将自己网站的“亮点”,综合成关键字,提供给著名的搜索引擎,比如百度、雅虎等,便于人们搜索,从而提高本网站的知名度和效益。

统计信息产品交易安全性问题

统计信息产品源于存放在各级政府、企业和部门中的统计数据,这些数据均涉及到了政府、企业和个人的机密或者隐私,所以对于数据的安全保障尤为重要。可以从两个方面进行有效的防范,一是从技术上加强系统安全建设,保证系统的正常运行和数据的安全,充分利用防火墙的技术,防范非法用户的侵入以及合法用户的未授权操作,为此可以建立三个系统:统计信息网络灾难恢复备份系统、统计信息网络安全管理系统、统计信息网络系统防病毒系统;二是从法律方面加以约束和惩治,统计信息产品具有可复制性容易泄密,为了数据的安全性就要求参与各方信守合同,做好数据或者方法的保密工作,可以采取的措施为:参与各方在交易前必须签订信息保密协议,把责任和义务明确,甚至可以和信息产品价格挂钩,也就是说将保密的成本计算入产品价格中,如果违背了合同、协议或者法律,造成的一切后果由违犯者承担。

统计信息产品提供方式及定价问题

由于统计信息产品有无形和有形的区别,所以在产品提供方式方面,对于有形的产品就需要物流配送,对于无形的产品可以借鉴网络图书,采取免费赠予、付费浏览和付费下载等多种方式。

统计信息产品电子商务化后,传统的定价不再适用,取而代之的是用户更能接受的以成本来定价,并依据成本来组织生产和销售。通过网络,可以预测用户的需求以及对价格认同的标准。用户通过网络提出接受的成本后,信息产品的生产者便可根据用户的成本提供产品的设计方案供用户选择,直到用户认可后再生产和销售。另外,还可以在网上公布行业定价规定。有关统计信息产品定价问题,比较复杂,需另外专门研究。

总之,统计信息产品电子化的发展是一个逐步完善的过程,需要解决以上这些问题,促进统计信息产品的电子商务化顺利发展。

参考文献:

网络统计范文篇9

访问量的多少是衡量网站是否成功的重要标准,但对于图书馆网站是远远不够的,图书馆需要获取完整的读者访问流量统计数据,来对图书馆信息资源的使用情况进行分析,网络信息计量学方法是目前网络界普遍采用的网站绩效评估计量法,被认为是可以用科学的方法检验网站访问数据的一种工具。它的目的包括了解网络读者的行为、确定网站是否吸引适当的读者来访、评定网站建设策略是否得当。其实施步骤可分为三个阶段:

(1)记录网站的访问数据;

(2)分析记录数据;

(3)为网站建设策略的改进提供依据。

1.1系统原理

由于网络站点和数据库本身具备了访问计量功能,各自的信息资源收藏状况便于人们掌握,并且能自动记录读者访问的登录情况,如登录名、登录时间、浏览文件、读者的来源地址等,这些数据资料能够准确反映读者访问信息和来源分布等情况,所以依据图书馆网络读者访问统计的工作内容,制定相应的分析指标,并收集网络读者访问图书馆信息资源站点形成的日志文件,然后利用日志统计工作软件定时对日志文件进行处理,得到统计数据,并动态生成各种表达形式的能满足图书馆各项统计分析工作的报表。最后把生成的分析报表导入到数据库中出去。

图书馆各个网络资源站点建设人员可通过浏览网络读者访问流量统计分析报告,分析和了解读者的访问需求,从而做好网络信息资源的建设工作。

读者行为分析研究则可通过对分析报告进行质化研究,并结合一般调查法、咨询研究法对读者的信息寻求行为进行研究。

本系统还可利用统计分析的结果来对系统自身工作进行评估和调整。

1.2分析指标

传统图书馆的分析指标和计量方法,虽然和数字化图书馆有很多不同,但使用的目的及计量的准则并没有太大实质性差异[4]。

参考传统图书馆的分析指标以及国内外类似的研究结果选定了下列10个分析指标:

(1)读者到访人数和潜在读者人数的百分比;

(2)到访读者表现了阅读的兴趣的百分比(采取明显的阅读行动);

(3)可能的读者转为经常的读者的百分比(经常阅读、下载资料);

(4)读者的持续度(重复到访读者);

(5)读者的忠诚度(网页浏览次数、再度到访的次数及时间长度);

(6)读者停止阅读行为的百分比(阅读行为半途中止);

(7)读者耗损率(现有读者中停止阅读行为者的百分比);

(8)读者动摇率(耗损的读者/到访读者的总数);

(9)读者最近到访时间(据上次到访的间隔时间);

(10)读者到访频率(多久到访一次)。

就此参数,我们可以从一个客观的角度来观察和评估图书馆网络读者访问情况。

1.3系统框图

网络读者流量统计分析系统功能框图

1.4工作方法

本系统工作方法主要是采集网络读者访问过程日志进行量化分析法,它的优缺点见表1。

读者访问过程日志分析法优缺点

量化分析法重视量的分析,本系统通过对访问过程日志以量的方法加以统计分析,首先根据为了研究读者需求分布和需求增长情况这一目的将研究内容归类成若干分析单元,接着将分析单元以数量的方式加以表达,进而以此为解释读者信息寻求行为的依据。

1.5技术实现

(1)系统结构

本系统是以浏览器/服务器/数据库体系结构作为基本架构,通过ASP方式实现交互式、动态的读者访问日志统计分析系统。系统结构框架如图2所示:

读者访问日志统计分析系统结构框图

(2)系统组成模块

本系统有六个模块组成:访问日志入库、访问流量分析、被访页面分析、来访读者分析和统计分析图表。

(3)系统运行环境与开发平台

本系统运行环境和开发平台如表2。

读者访问日志统计分析系统模块

表2系统运行环境及开发平台一览表

软件类别软件名称

数据库SQLServer2000+FastTrendsDatabase

操作系统Windows2000SP4Server+Aix4.3.3

Web服务器软件IIS5.0+Apache3.0

浏览器软件IE5.5

网页制作Frontpage2000+javascript

ASP工具EditplusTextEditor

编程语言VisualBasic6.0

图表软件Excel2000

(4)程序流程与代码实现

该系统由main.asp(主界面程序)、flux.asp(小时、日、星期流量分析)、target.asp(被访页面分析)、visitor.asp(来访读者分析)、chart.asp(统计分析图表)五个组成。

我们以“被访页面分析”模块的程序流程和代码说明系统组成模块的实现过程,该模块程序流程图如图4。

“被访页面分析”程序流程图

相应代码:

<table

<tdclass=定义的表格形式及表头>

Setconn=server.creatobjectl("adodb.connection")

conn.open"dsn=dsn_dbs;uid=xxx;pwd=xxx"

Setre=server.creatobject("adodb.recorderset")

re.activeconnection=conn

dbname=Application("logtime")——数据表名称

re.open“QL语句”

dowhilenotre.eof

执行Recordset操作,服务器进行统计计算

response.write——写入统计表

re.movenext

loop

re.close

程序中一些代码说明:

①Recordset的Open方法:允许用户向数据库发出请求,通常是运行sql命令。如:Sqlquery="selectlogtimefromintemetlogwhereday(logtime)=day(getdate())andmonth(logtime)=month(getdate())andyear(logtime)=year(getdate())"Dbrs.opensqlquery,dbconnection,3,3

②Recordset的RecordCount属性:可以取得当前在Recordset对象中的记录条数。如:setdbrs=server.createobject("ADODB.recordset")amount=dbrs.recordcount

③Recordset的MoveNext方法:移动指针到Recordset对象的下一条数据。如:Dbrs.movenext

④Response的Write方法:负责将字符串信息输出的用户端。如:Response.write“页面总访问量:“&amount&”<br>

⑤Recordset的Close方法:可以用来关闭指定的Recordset对象。如:Dbrs.close

1.6系统运行过程

下面以西安交通大学图书馆网站为统计分析对象说明该系统运行过程。

首先我们用FTP工具抓取网址为的服务器,时间段为2003/01/01到2003/12/31的访问日志导入到数据库中,该服务器完成图书馆网站的部分功能:门户信息、OPAC、馆际互借、电子期刊、网络数据库、网络资源、参考服务等。

对日志分析系统进行运行参数设置:读者访问时间间隔设为20分钟;从最新QQ显IP版软件中导出读者IP地址分配资料,转换格式后导入到日志分析系统的地址表中,以便对读者分群;设置过滤规格文件滤掉一些无用的访问信息,如背景图片、图书馆Logo,页面美化图片和服务器漏洞扫描日志等日志信息,然后对服务器访问日志进行初步统计分析,保存统计分析结果准备进行进一步统计分析。

最后利用精致多样的统计分析方法对初步统计结果进行统计分析,统计分析出的数据有:一年内资源点击与访问计数;一年内网站中最常使用的资源与服务;一年内点击次数最多的读者;一年内务分群读者的点击次数比例;一年内点击次数与阅读次数的变化;一年内上网的读者与累积成长趋势;一周各天的平均点击次数;一天内各时段的平均点击次数;校内各区读者点击次数比例;各项相关资源被使用的情形等等。这些数据可用Eexel软件生成直观的统计分析图表,部分图表详见实际应用一节中。本系统的研究主要采用访问过程日志分析法,以内容分析法、问卷调查法辅助研究。主要考虑:一是这种方法在电子商务和其它网络应用的量化分析,已经有许多研究成果,可使我们的研究更为便利;二是可以经济的,较具体客观的分析到网络读者信息需求特性;三是通过定量的计算,定质的分析,形成一种综合分析的方式,以求分析结果更为客观和科学。

2系统的实现

访问量的多少是衡量网站是否成功的重要标准,但对于图书馆网站是远远不够的,图书馆需要获取完整的读者访问流量统计数据,来对图书馆信息资源的使用情况进行分析,网络信息计量学方法是目前网络界普遍采用的网站绩效评估计量法,被认为是可以用科学的方法检验网站访问数据的一种工具。它的目的包括了解网络读者的行为、确定网站是否吸引适当的读者来访、评定网站建设策略是否得当。其实施步骤可分为三个阶段:

(1)记录网站的访问数据;

(2)分析记录数据;

(3)为网站建设策略的改进提供依据。

2.1系统原理

由于网络站点和数据库本身具备了访问计量功能,各自的信息资源收藏状况便于人们掌握,并且能自动记录读者访问的登录情况,如登录名、登录时间、浏览文件、读者的来源地址等,这些数据资料能够准确反映读者访问信息和来源分布等情况,所以依据图书馆网络读者访问统计的工作内容,制定相应的分析指标,并收集网络读者访问图书馆信息资源站点形成的日志文件,然后利用日志统计工作软件定时对日志文件进行处理,得到统计数据,并动态生成各种表达形式的能满足图书馆各项统计分析工作的报表。最后把生成的分析报表导入到数据库中出去。

图书馆各个网络资源站点建设人员可通过浏览网络读者访问流量统计分析报告,分析和了解读者的访问需求,从而做好网络信息资源的建设工作。

读者行为分析研究则可通过对分析报告进行质化研究,并结合一般调查法、咨询研究法对读者的信息寻求行为进行研究。

本系统还可利用统计分析的结果来对系统自身工作进行评估和调整。

2.2分析指标

传统图书馆的分析指标和计量方法,虽然和数字化图书馆有很多不同,但使用的目的及计量的准则并没有太大实质性差异[4]。

参考传统图书馆的分析指标以及国内外类似的研究结果选定了下列10个分析指标:

(1)读者到访人数和潜在读者人数的百分比;

(2)到访读者表现了阅读的兴趣的百分比(采取明显的阅读行动);

(3)可能的读者转为经常的读者的百分比(经常阅读、下载资料);

(4)读者的持续度(重复到访读者);

(5)读者的忠诚度(网页浏览次数、再度到访的次数及时间长度);

(6)读者停止阅读行为的百分比(阅读行为半途中止);

(7)读者耗损率(现有读者中停止阅读行为者的百分比);

(8)读者动摇率(耗损的读者/到访读者的总数);

(9)读者最近到访时间(据上次到访的间隔时间);

(10)读者到访频率(多久到访一次)。

就此参数,我们可以从一个客观的角度来观察和评估图书馆网络读者访问情况。

2.3系统框图

网络读者流量统计分析系统功能框图

2.4工作方法

本系统工作方法主要是采集网络读者访问过程日志进行量化分析法,它的优缺点见表1。

读者访问过程日志分析法优缺点

量化分析法重视量的分析,本系统通过对访问过程日志以量的方法加以统计分析,首先根据为了研究读者需求分布和需求增长情况这一目的将研究内容归类成若干分析单元,接着将分析单元以数量的方式加以表达,进而以此为解释读者信息寻求行为的依据。

2.5技术实现

(1)系统结构

本系统是以浏览器/服务器/数据库体系结构作为基本架构,通过ASP方式实现交互式、动态的读者访问日志统计分析系统。系统结构框架如图2所示:

读者访问日志统计分析系统结构框图

(2)系统组成模块

本系统有六个模块组成:访问日志入库、访问流量分析、被访页面分析、来访读者分析和统计分析图表。

(3)系统运行环境与开发平台

本系统运行环境和开发平台如表2。

读者访问日志统计分析系统模块

(4)程序流程与代码实现

该系统由main.asp(主界面程序)、flux.asp(小时、日、星期流量分析)、target.asp(被访页面分析)、visitor.asp(来访读者分析)、chart.asp(统计分析图表)五个组成。

我们以“被访页面分析”模块的程序流程和代码说明系统组成模块的实现过程,该模块程序流程图如图4。

“被访页面分析”程序流程图

相应代码:

<table

<tdclass=定义的表格形式及表头>

Setconn=server.creatobjectl("adodb.connection")

conn.open"dsn=dsn_dbs;uid=xxx;pwd=xxx"

Setre=server.creatobject("adodb.recorderset")

re.activeconnection=conn

dbname=Application("logtime")——数据表名称

re.open“QL语句”

dowhilenotre.eof

执行Recordset操作,服务器进行统计计算

response.write——写入统计表

re.movenext

loop

re.close

程序中一些代码说明:

①Recordset的Open方法:允许用户向数据库发出请求,通常是运行sql命令。如:Sqlquery="selectlogtimefromintemetlogwhereday(logtime)=day(getdate())andmonth(logtime)=month(getdate())andyear(logtime)=year(getdate())"Dbrs.opensqlquery,dbconnection,3,3

②Recordset的RecordCount属性:可以取得当前在Recordset对象中的记录条数。如:setdbrs=server.createobject("ADODB.recordset")amount=dbrs.recordcount

③Recordset的MoveNext方法:移动指针到Recordset对象的下一条数据。如:Dbrs.movenext

④Response的Write方法:负责将字符串信息输出的用户端。如:Response.write“页面总访问量:“&amount&”<br>

⑤Recordset的Close方法:可以用来关闭指定的Recordset对象。如:Dbrs.close

2.6系统运行过程

下面以西安交通大学图书馆网站为统计分析对象说明该系统运行过程。

首先我们用FTP工具抓取网址为的服务器,时间段为2003/01/01到2003/12/31的访问日志导入到数据库中,该服务器完成图书馆网站的部分功能:门户信息、OPAC、馆际互借、电子期刊、网络数据库、网络资源、参考服务等。

对日志分析系统进行运行参数设置:读者访问时间间隔设为20分钟;从最新QQ显IP版软件中导出读者IP地址分配资料,转换格式后导入到日志分析系统的地址表中,以便对读者分群;设置过滤规格文件滤掉一些无用的访问信息,如背景图片、图书馆Logo,页面美化图片和服务器漏洞扫描日志等日志信息,然后对服务器访问日志进行初步统计分析,保存统计分析结果准备进行进一步统计分析。

最后利用精致多样的统计分析方法对初步统计结果进行统计分析,统计分析出的数据有:一年内资源点击与访问计数;一年内网站中最常使用的资源与服务;一年内点击次数最多的读者;一年内务分群读者的点击次数比例;一年内点击次数与阅读次数的变化;一年内上网的读者与累积成长趋势;一周各天的平均点击次数;一天内各时段的平均点击次数;校内各区读者点击次数比例;各项相关资源被使用的情形等等。这些数据可用Eexel软件生成直观的统计分析图表,部分图表详见实际应用一节中。本系统的研究主要采用访问过程日志分析法,以内容分析法、问卷调查法辅助研究。主要考虑:一是这种方法在电子商务和其它网络应用的量化分析,已经有许多研究成果,可使我们的研究更为便利;二是可以经济的,较具体客观的分析到网络读者信息需求特性;三是通过定量的计算,定质的分析,形成一种综合分析的方式,以求分析结果更为客观和科学。

3实际应用

从2002年开始,我们从图书馆门户网站读者访问计数开始了网络读者访问统计工作,从最初的图书馆首页访问计数到现在应用网络读者访问流量统计分析系统到以信息资源站点、数据库为单元的访问利用上,取得了不少研究成果,下面我们介绍以2003年西安交通大学图书馆网站读者访问日志为统计对象,获得的一些统计分析结果。

表3是2003年图书馆网站的资源浏览次数,访问次数与访问读者数的统计表,我们看到一年内资源的浏览次数是10,222,296,访问次数是1,617,166,访问读者是310,628,对照2003年西安交大统计公报教职工5341人,在校学生32766人的数据表明图书馆网站有很高的访问量。另外网络访问读者310,628远远大于学生和教职工的总和,表明有相当多的读者使用本馆的资源,这说明本馆的信息资源丰富,吸引了很多读者。网站不足之处是自建的外文资源很少。从表3看,来自国内访问占6.43%,来自国外访问占0.01%。综合以上资料,西安交大图书馆网站为校内外读者提供了方便、丰富的资源服务,吸引了大量的读者,但在国外的知名度很低,现有资源不能吸引国外读者,对此图书馆采取一些措施,来解决这个问题。

接着我们看一年间网络读者常使用的网站资源与服务,图5显示的是读者最常使用的前十项网站资源与服务以及它们占全部浏览次数的百分比。从图中我们观察到前十项占了访问量的43%,第一项是图书馆首页,然后依次是网络数据库、联机公共目录查询、中国期刊网……,这说明图书馆网站的资源内容设计与规划合理,读者访问资源方便,相关信息更新及时,受到了读者的欢迎。另外,网络数据库和联机公共目录访问比例接近说明读者并重利用印刷型资源和数宇化资源,数字化资源对科研和教学的作用日益明显。从图5中我们还观察到所有的电子数据库访问所占比例值呈现出指数下降的趋势,这说明较少数数据库的访问量较大,而较多数数据库访问量较少,根据这个特点,图书馆在采购数据库时可采取不同的采购策略,对于使用量大的数据库保证数据的更新量和连续性,则可满足约80%的读者信息需求,对于较多的使用量少的数据库可采用合伙采购共同使用的办法,来满足约20%的读者信息需求。

图书馆网站前十名资源与服务以及它们占全部访问次数的比例(01/01/2003-12/31/2003)

接下来我们来分析常访问的读者及其来源,首先,图6中表示网络读者访问次数的分布,从图6中可以看出75.15%的读者只访问过一次,9.86%的读者访问过两次,6.49%的读者则经常访问图书馆网站,这说明作为一个为大学教育和科研服务的信息中心,图书馆的网络资源已经有了固定的读者,但还有大量读者的信息需求不能满足,为此图书馆通过参加一些文献信息资源建设项目和组织,如中国高等教育文献保障体系(CALIS),陕西省科技情报协作网等,以便获取更多优质的文献信息资源,增强图书馆文献信息资源的保障能力。另外,图书馆信息资源大多数有访问权的限制,校外的读者无法接触到,为此图书馆采取了一些办法,如建立电子数据库导航库,电子期刊导航库,提供文献传递等服务来满足校外读者的信息需求。表4是常来图书馆网站的读者统计数据,可以观察到前二十名读者绝大部分是西安交大校园网的读者占全部来访数的4.61%。如果以其上网所属机构来划分来访的网络读者,图7是前十名各类机构网络读者的访问。从图7中,我们可以清楚的看到本校的用户占73%,其中来自科学馆的访问占3.23%,图书馆的读者占3.18%,西一楼的2.34%,可见西安交大的校园网比较普及,读者能够很方便的进入图书馆资源网站,这也表示图书馆提供给读者阅读电子资源的电子阅览室满足了读者需要。在图7中数据显示,外校的读者也经常访问图书馆网站,如西安理工大学的读者占0.33%,长安大学的占0.31%,北京大学的占0.05%,西北工业大学的占0.17%,上海交大占0.08%等等,这些读者主要使用联机公共目录查询和使用自建数据库,这说明高校间的信息共享正在发展,图书馆应该加强自建特色数据库的建设,增强文献传递和馆际互借服务,满足这些读者的信息需求。

接下来我们来观察各类读者在每个月访问网络资源的比例变化图,见图8是各类网络读者访问前十名网络资源的变化图,总体访问变化的趋势和学校的校历安排有明显的关系,每个数据库的访问量变化则和各类读者的信息需求不同有关系。这反映了读者的结构影响着网站的使用情形。

网络读者访问图书馆网站次数分布(01/01/2003-12/31/2003)

前十名各类主机访问图书馆网站的访问次数(01/01/2003-12/31/2003)

各类网络读者对前十名网络资源访问变化图(01/01/2003-12/31/2003)

由于篇幅有限,我们简单介绍了本系统对图书馆网站网络读者访问流量的统计分析结果,在以上的讨论中,可以观察到读者利用网络信息资源是联机公共目录检索和信息检索并重,且大部分读者是本校的。

通过上述讨论,我们知道本系统还有许多值得进一步研究之处,下一步的研究方向是收集更完整的读者访问日志,包括更长期的和所有与图书馆资源访问相关的。并且尝试利用精致的统计方法来分析,以达到对网络读者行为更精确的解读。

4结语

经实际应用证明,该系统对我馆信息资源建设起到了重要的促进作用。首先,在控制我馆信息资源存放空间问题上,虽然目前看来效果不明显,但如果越来越多的信息资源杂乱无章地占据信息空间,将会大大降低信息检索的效率,干扰核心信息源的利用。本系统可以提供调整信息存放的定量依据,在探明各类型信息资料数量特征的基础上,分析其增长和老化规律,判断信息的价值和时效性,使有价值的信息充分地发挥作用,使信息空间得到有效的利用。

其次,在“以人为本”的理念指导下,图书馆走出了单纯提供馆藏信息资源为中心的定位,着眼于满足读者广泛的信息需求。在本系统的指导下能实现这个目标:一是根据信息资源规律反映出的学术动态和信息利用规律反映出的需求动态,指导图书馆的馆藏资源建设。二是通过对信息资源利用规律的研究,使计算机信息检索系统走向科学化、规范化,从而方便用户查询。

在整个研究过程中,取得了一些研究成果,也发现有不少问题等待我们进一步的研究,首先是无法取得确实充分的数据,主要问题是图书馆提供的网络数据库是联接到厂商的数据库中去检索的。如果图书馆自己没有服务主机,那么就要请厂商提供访问数据,虽然厂商都会提供月报表,但是能够判读的资料不多,或是他提供的数据不标准,或是他提供资料不是图书馆想要的。其次不易解释数据,有了访问过程记录数据,可是怎么去解释它?读者从哪里来,做什么,这个比较容易解释,可是要知道读者做某件事的动机,就没有办法从数据中去解释了。

【参考文献】

1WonsikShim,CharlesR.McClure,JohnCarloBertot&JamesT.Sweet.ARLE—MetricsProject:DevelopingStatisticsandPerformanceMeasurestoDescribeElectronicInformationServicesandResourcesforARLLibraries:PhaseOneReportTallahassee,FL:InformationUseManagementandPolicyInstitutc,SchooloflnformationStudies,2000./stats/newmeas/emetrics/phaseone.pdf(AccessedSep.10.2001)

2詹丽萍.E-metrics在数字图书馆使用评估的应用.数字图书馆与数字博物馆趋势研讨会,2001:21-30

3邹菲.试论网络信息计量学在数字图书馆中的应用.图书情报知识,2001(1):16-20

网络统计范文篇10

物理方面的风险。物理安全是整个网络系统安全的前提,不可控的自然灾害如地震、水灾、雷击等,一但发生必会造成工作混乱甚至整个系统的毁灭,从而造成统计信息的丢失。电磁辐射会造成统计数据信息被窃取或被偷阅,报警系统的设计不足可能造成一些原本不该发生的异常事故。

黑客的恶意攻击。黑客是网络时代的不良产物,它可以各种可能的方式攻击系统,破坏系统中的信息或设备,损害其有效性和完整性。统计系统一般都有内网和外网,有时既使外网及内网与外网之间采取了一定的安全防护措施,外网甚至内网还是有漏洞可钻,还可能会受到某些入侵者的攻击。

软件漏洞和缺陷。目前网络软件不可能做到百分百的无缺陷和无漏洞,这些漏洞和缺陷常常是黑客们攻击的目标。大部分的黑客入侵都是因为安全措施不完善造成的。还有,为了使用户调试和维护方便,有些软件开发商在开发软件时留有“暗窗”,这些“暗窗”也会成为非法入侵者的通道。