学术期刊投稿语言正确性

时间:2022-01-05 09:56:39

学术期刊投稿语言正确性

学术期刊投稿网站网页标记语言正确性之探当前,我国大多数的学术期刊都建立了论文投稿网站系统以方便作者投稿和专家审稿,期刊的编辑也可以应用网站系统对投稿作者的文章进行管理和审核,因此论文投稿网站系统的设计与维护非常重要。据NetMarketShare的数据,截止2015年7月,占据全球浏览器排行榜首位的仍然是IE浏览器,总市场份额为53.47%,Chrome浏览器位居第二位,最新市场份额27.66%,Firefox火狐浏览器以12%的市场份额位居第三位。由于各个网页浏览器对网页标记语言的解释与执行有一些差异,加上网页设计语言的多样化,可能会造成论文投稿作者使用的浏览器打不开网站的情况,即会出现网页设计语言与浏览器相互不兼容的情况出现。设计的网页如果能遵守规范,就能确保网页架构与语法的正确性,也可以满足用户广泛浏览的需求。对论文投稿作者而言,遵守规范的网页能够减少投稿的困难度,让网页适用于更多的载体(移动端屏幕、电脑浏览器等),并减少错误信息的传递;对论文投稿网站的管理者而言,符合规范的网页较容易维护,因编辑团队可能随着时间的推移不断替换,对于新进人员而言容易了解及修改。另外,符合规范的网页也能够增进网页在网络上的可见度,提高搜寻引擎排名[2],使论文投稿作者更容易在网络上搜索到该投稿网站。查阅中国知网、万方数据库等国内文献检索系统,发现目前国内并未有学者进行过相关的研究,查阅WebofScience、EBSCO等外文文献系统,发现国外学者对网页标记语言正确性检测方面的研究也较少,主要的研究有Chen等人[3](2005)利用网页检测工具了解网络上网页正确性的比例,并期望找出最常出现的错误类型。Chen等人的研究结果显示,有高达95%的网页不符合网页标准,并且不论使用何种网页样本搜集方式,前十大错误种类几乎完全一致。Breeding[4](2006)使用W3C的MarkupValidationService检测美国研究图书馆协会的123个会员图书馆首页,进行网页正确性调查。研究结论显示,除了21所图书馆完全符合W3C的规范,其余均出现了错误,甚至有7所图书馆错误数达100个以上,错误率高达82%。网页设计语言作为一种在网络上被广泛接受的计算机语言,是由国际万维网联盟(WorldWideWebConsortium)所制定并规范化。关于网页设计语言方面的研究,目前众多学者进行了多角度的研究探讨[5-11]。网页设计语言不是一般的程序设计语言,而是一种网页标记语言(MarkupLanguage),最为经典的网页标记语言HTML被称为超文本标记语言(HyperTextMarkupLanguage),其主要使用标记标签(markuptag)来描述网页。论文投稿网站的管理者可通过不同的检测工具(validator或checker)检测网页是否符合规范,如网页架构与语法的正确性可通过W3C(WorldWideWebConsortium)的网页标记语言检测器(markupvalidator)进行相关检测。论文投稿网站网页架构与语法正确性与否会直接影响论文投稿服务的可访问性与正确性。因此,本研究期望通过W3C网页标记语言检测工具的应用,检测我国论文投稿网站网页标记语言正确性(webmarkuplanguagevalidation)程度及问题,并试图提出解决方法,以供论文投稿网站经营管理或建设发展作为参考。

1网页标记语言正确性检测

1.1研究工具。目前,网页检测工具较多,提供的检测功能也有所不同,能够进行各种浏览器的兼容性测试、负载测试,以及网页标记语言检测等。比较知名的网页检测工具有Googlewebpagetester、BrowserShots、IETester、Feedvalidator等。网页正确性检测是W3CWebQualityTools中的功能,主要包括:(1)标记检测(MarkUpValidator),可用于检测网页上的各种常用的标记语言的规范性和正确性,如HTML、CSS、XHTML、XML、WML等;(2)Web内容的数据交换规范(FeedValidator),用于检测Atom或RSSfeed语法的规范性和正确性;(3)层叠样式表检测(CSSValidator),用于检测内嵌在HTML、XHTML中的CSS样式的规范性和正确性;(4)超链接检测(LinkChecker),用于检测网页中超链接(Link)和锚点(anchor)的规范性和正确性。本研究主要使用W3C提供的网页标记语言检测工具(MarkUpValidator),检测论文投稿网站上网页的各种常用的标记语言的规范性和正确性。通过该工具可以检测出受测网页的错误数(W3C网页标记规范性)、服务器种类、网页大小、网页格式、网页编码(GB-2312或其他)、文件类型等,并会列出错误之处及建议改进的方式。检测的方式除了可以直接输入网址外,也可以上传该网页的源代码进行检测。图1为网页标记语言检测的主界面,本研究主要采用输入统一资源定位符(URL)的方式进行网页检测。检测结果分成两部分;一部分是结果摘要,叙述错误数、警告数、编码(Encoding)及网页格式(Doctype)是什么版本等,如图2所示。另一部分则为检测出的错误或警告详细结果,并列出改正建议如图3所示。1.2研究样本。由于我国学术期刊的投稿网站较多,难以对所有的论文投稿网站的所有网页标记语言的正确性进行检测,因此本研究需要选择一定数量的样本进行检测工作。参考北京大学图书馆公布的2014版《中文核心期刊要目总览》,本研究选择其中列出的出版事业类12种期刊,以及图书馆事业、信息事业类的18种期刊进行研究(总计30种期刊),选择这些期刊作为研究样本的原因一方面是这些期刊均属于中文核心期刊,在网络上得到的关注度比普通的期刊高[12],一方面是出版类、图书情报类的期刊属于专门研究期刊编辑出版等问题的专业期刊,研究这些学术期刊建立的论文投稿网站网页标记语言的正确性和规范性具有一定的示范作用。由于选取的30种期刊中有部分期刊没有建立论文投稿网站系统,部分仅有Email投稿方式,因此在研究中需要将这些期刊忽略,最终所选取的期刊如表1所示,有效样本为21个,取样日期为2016年4月5日。由于考虑首页为论文投稿作者首先打开的界面,其网页标记语法的正确性将首先影响到用户的操作,因此本研究将检测目标锁定在论文投稿系统网站的首页(MainPage),在网页标记语言检测的主界面中输入首页的统一资源定位符(URL)进行检测,并记录其检测结果。

2检测结果的统计分析

本研究主要基于W3C的网页标记语言检测工具,从网页格式定义种类(Doctype)、网页错误数及网页错误类型进行分析,从中了解学术期刊论文投稿网站在网页标记语言上的问题,以及提出建设参考意见。在对有效选取的21个期刊论文投稿网站首页进行检测的过程中,19个期刊的论文投稿网站能够正常进行检测,但有两个期刊论文投稿网站(大学图书馆学报、现代情报)的首页无法检测,其中大学图书馆学报的网站对检测进行了禁止设置(Forbidden),现代情报网站在检测中无法找到(NotFound)。2.1网页格式定义种类及网页错误数。网页格式如果没有定义,除了在内容呈现上可能出现错误,在数据交换及传输时可能也会出现问题,除了会造成数据的流失,有时还会导致错误信息的传递。对于论文投稿网站的网页格式定义类型,除了两个无法检测的期刊网站之外,其余19个期刊的论文投稿网站均对网页的格式进行了定义,包括两种W3C定义标准,HTML4.01Transitional和XHTML1.0Transitional,具体的定义类型可见表2。由表2可以看出,有6个学术期刊的论文投稿网站采用的是XHTML1.0Transitional的格式。相对于HTML4.01Transitional而言,XHTML标记语言,通过结合XML和HTML的功能,使得网页内容更容易被手持移动设备以及电视媒体等访问。对于网页错误数,被检测的19个期刊论文投稿网站首页的网页标记语言都出现了错误,出现错误数最少的是中国科技期刊研究和中国图书馆学报,部分期刊的网页标记语言错误数较多,如出版科学、情报科学、图书馆理论与实践。2.2网页错误类型。国际万维网联盟网页标记检测服务(W3CMarkupValidationService)给出定义的错误类型总共有447种(详见validator.w3.org/docs/errors.html#noverbose),本研究检测的19个期刊论文投稿网站的网页错误类型经过统计有121种错误类型,主要的错误原因在于标记属性使用错误或者未加定义。期刊论文投稿网站首页的前几项错误项目分别是Thereisnoattribute“……”(136次)、Documenttypedoesnotallowelement“……”here(104次)、Requiredattribute“……”notspecified(91次)及Element“……”undefined(85次)。属性定义有误在信息的显示上可能不会出现问题,网页内容能够正常呈现,但对于数据的交换及传递会有一定程度地影响。在统计的121种错误类型中,属于标签(Html-Tag)的错误数最多,说明期刊论文投稿网站的网页大多数为Html标签的定义或使用错误,因此在撰写Html语法时应注意标签的使用正确性。另外,由于网页制作软件的可视化和方便性,使得网页设计人员更容易的设计制作动态化的脚本语言,导致脚本(Script/Script-Tag)出错的数量也偏高。由于19个期刊论文投稿网站网页的错误类型和数量较多,无法用表格的形式一一列出,图4为中国图书馆学报的检测结果,可以看出中国图书馆学报的论文投稿网站的网页没有出现标记使用属性方面的错误,仅有两条格式定义类型的错误。

3研究结论及建议

本研究利用国际万维网联盟的网页标记检测工具检测学术期刊论文投稿网站的首页标记语言正确性和规范性,通过网页格式定义(Doctype)种类、网页错误数及网页错误类型三项指标,期望了解学术期刊论文投稿网站网页标记语言的正确性程度及问题,并提出网页错误的修正建议,以供论文投稿网站经营管理或建设发展作为参考。在网页格式定义方面,由于不同的网页格式定义有可能导致信息呈现上的差异,甚至造成信息差错或遗失。本研究中被检测的19个学术期刊论文投稿网站的网页格式定义有两种:HTML4.01Transi-tional和XHTML1.0Transitional,XHTML1.0Transitional格式结合了XML和HTML的功能,使得网页的包容性更强,因此采用XHTML1.0Tran-sitional格式的网页更好一些,研究中发现采用XHTML1.0Transitional格式的期刊为编辑学报、中国科技期刊研究、情报学报、图书馆、图书馆理论与实践、情报杂志。在网页错误数量及类型方面,学术期刊论文投稿网站首页标记语言的正确性检测通过率为0,部分期刊投稿网站的错误数较多。网页标记错误最少的期刊是中国科技期刊研究和中国图书馆学报。在网页错误类型方面,最常出现的错误类型为标记使用错误或未定义的属性(attribute),说明在建设期刊论文投稿网站的网页时,需要注意属性的使用。另外,在统计的121种错误类型中,属于标签(Html-Tag)的错误数最多,说明期刊论文投稿网站的网页大多数为Html标签的定义或使用错误,因此在撰写Html语法时应注意标签的使用正确性。在研究中也发现网页标记的错误大多为网页语法与标签结构上的错误。在语法方面,开始结束的标签没有详细注明,例如有序列表标签始于<ol>标签,每个列表项始于<li>标签,标签的位置放置错误。在某些浏览器如IE可能会对不规范的标签进行自动调整和修正,但不能保证所有浏览器都可正常浏览。另外,如在有序列表标签中,省略了某一列的<ol>和<li>也不符合网页标记语言的规范性。除了语法上的错误,网页结构也会出现错误,例如<html>、<head>与<body>三者有规范顺序及位置,<head>包含于<body>中即不符合规范,可能会造成信息呈现上的问题。此外,如果出现Cannotcontinuebecauseofpreviouserrors错误信息,则可检查该行错误之前的网页语法是否有误。这些语法及结构错误,对数据交换及传递将产生一定程度的影响,降低信息的传递速度。由于网页格式定义未统一,及偏高的错误率,学术期刊论文投稿网站的网页标记语言正确性有相当大的改善空间。造成网页标记语言正确性低的原因,除了可能是网页制作人员不熟悉网页语法,网页制作软件无严格规范用户使用各对象及功能也是导致网页语法错误的因素之一。论文投稿网站是学术期刊面向论文作者提供服务的重要平台,网站内所有的网页均代表学术期刊服务的目标,因此期刊论文投稿网站整体的正确性检测就如同对期刊编辑出版工作的审视,学术期刊应将期刊论文投稿网站正确性的检测视为期刊管理业务之一,而网站正确性与投稿作者对期刊论文投稿网站服务满意度是否存在关联性,亦有必要进一步深入探讨,以作为学术期刊经营管理决策的参考。