联盟链构建高校智慧校园数据共享平台

时间:2022-11-07 10:50:16

联盟链构建高校智慧校园数据共享平台

摘要:在高校中,各部门根据自己的职责与需求建设独立的业务系统,如人事系统、教务系统、财务系统等,各部门独自管理各自领域的数据。随着智慧校园的推进,需要将各部门的数据进行统一管理与应用,然而当前以中心化形式存在的数据中心存在着信任、授权、安全等问题。本文基于联盟链技术,采用区块+链的存储方式,并通过Raft共识机制完成各节点的数据同步,最后通过智能合约的方式完成数据的访问与应用。基于联盟链技术的数据共享平台可以解决数据安全性、权限控制、随意篡改等问题,消除数据孤岛,提高数据的共享与利用。

关键词:联盟链;Raft;智能合约;数据孤岛;数据安全

1引言

自2019年10月24日将区块链上升为国家战略以来,我国相继出台相关政策支持区块链研究。区块链作为比特币的底层基础架构,被视为继蒸汽机、电气化、计算机之后第四次工业革命的重要成果[1]。区块链技术在教育、医疗、金融、政务、电子存证、数字身份等各领域不断铺开,场景的深入化和多元化不断加深。通过融合区块链技术和高校信息化建设,优化和重塑高校数据共享、教学科研、行政办公等,从数据层面、业务层面、体制层面等进行重构,对今后的高校信息化新基建提供路径创新。2018年国家标准化管理委员会公布《智慧校园总体框架》,提出“智慧校园=1个数据中心+智慧校园基础设施+八类智慧校园应用系统+智慧性资源”的概念。步入2022年,多数高校已经完成系统集成、门户集成、统一资源平台、云平台等信息化建设,越来越多的高校信息化建设重心开始向智慧化建设方向转移[2]。虽然高校已经进行了十几年的智慧校园建设,但全国范围内智慧校园取得良好成果的高校案例占比很低,其中成功的建设案例也主要集中于高校的某一个业务点。高校智慧校园建设难以取得良好成果的一个重要原因是数据管理与共享问题[3]。

2高校内数据现状

随着智慧校园建设的不断深入,越来越多的学校意识到,一个部门收集到的大量数据可以帮助其他部门实现工作目标。但在实践中,或是出于想保护本部门数据,或是不同部门间数据库不兼容,总之最终导致很多数据难以在校园内共享,难以充分发挥其价值。

2.1数据安全问题

高校数据包括教务数据、财务资产数据、办公数据、科研数据、图书数据、消费数据等,这些都是不可外泄且不可篡改的数据,需要进行严格管控,但可能存在业务办理人员、系统管理人员、数据库管理人员等多方串通对系统中的某些数据进行篡改、泄露,或不法分子通过攻击高校信息系统获取数据并滥用的情况,这将对个人隐私、数据可信度、学校形象等造成严重影响与巨大损失。

2.2数据质量问题

数据质量是保障智慧校园建设质量的基础,“坏”数据比没有数据更糟糕。在高校信息化建设过程中暴露出很多数据质量不足的问题,主要由三个方面造成:一是数据源头不明确,造成数据唯一性、准确性问题,主要原因是部门管理职能有所重叠以及多个业务系统重复采集。二是数据格式不统一不完整,对数据的完整性和语法等问题造成影响,这是由于不同部门甚至不同操作员对同一数据的处理方式不一致或误操作导致。三是数据不及时,造成时效性、准确性问题,由于数据采集周期、同步推送周期、同步推送方式等问题,导致各使用端使用的数据可能不是最新的。

2.3数据共享问题

智慧校园的建设依赖于各个部门的数据,但现实是在高校内数据共享存在几个问题:一是信息孤岛和信息烟囱的现象在高校中真实存在。二是同时多个部门共享出来的数据有限,不能支撑智慧校园的建设需求。三是共享时效性无法保证。四是共享技术手段不能完全通过自动化技术实现,很多场景下还需要通过拷贝数据文件的方式导入到其他业务系统。造成这些问题的原因也是多方面的,包括各部门信息化标准不一致、数据的安全性要求高、数据的访问权限、技术手段达不到等。

3区块链应用设计

本文研究的需要上链的数据,主要是指在高校业务开展中产生的应用价值高,共享需求强,安全性要求严格的需要上链的全域数据,而不是全量数据。基于联盟链构建的数据共享平台的主要功能是对需要上链的数据,做好数据安全、数据质量及数据共享方面的管理工作。主要目的是利用区块链技术解决高校存在的数据管理与共享问题,建立一套安全、完整、准确、及时的高校数据共享系统。从而实现:一,实现数据资源在全校各部门共享和流转,提升数据的服务能力,降低数据利用的安全风险,进一步挖掘数据的价值,为智慧校园建立优质的数据基础;二,通过区块链技术辅助各部门建立一套通用数据标准,并通过智能合约规约数据的共享与交互,这不仅可以减少人工参与,提高数据准确率,节约人工成本及运维成本,还可以减少各系统内部数据的重复采集和功能的重复开发,降低系统的研发成本。

3.1区块链数据结构

区块链是一种源自于“比特币”的底层技术,是分布式账本和去中心网络的组合。其中,分布式账本是由区块连接形成的链。从第一个区块即所谓的创世区块开始,新增的区块不断地被连到上一个区块的后面,形成一条链条。每个区块由区块头部和区块数据组成。区块头部中有一个哈希指针指向上一个区块,这个哈希指针包含前一个数据块的哈希值。哈希值可以被看成是数据块的指纹,即在后一个区块的头部中均存储有上一个区块数据的指纹。如果上一个区块中的数据被篡改了,那么数据和指纹就对不上号,篡改行为就被发现了。要改变一个区块中的数据,对其后的每个区块都必须相应地进行修改。在比特币中,区块链的数据结构中有两种基于哈希的数据结构,它们均是不可篡改特性的基础。一种是形成“区块+链”的链状数据结构,可使对某一区块内的数据的修改很容易被发现;另一个是哈希指针形成的梅克尔树[4],可使得对区块中任何交易数据的修改很容易被发现。在高校数据区块链底层结构设计中,可以采用类似的数据结构进行数据记录。

3.2共识算法

区块链之所以需要共识机制是因为区块链网络是一个非基于信任的去中心网络,并且这些节点分散在网络条件差异非常大的全球互联网之中。共识机制即为这些节点达成一致的机制。网络中各节点愿意打包交易、维护账本,它们并非出于“善意”,而是因为它们能因这些生成区块的行为获得某种形式的激励。本文对公有链中经典的POW共识算法及联盟链中经典的Raft共识算法展开说明。3.2.1POWPOW(工作量证明)是比特币所采用的共识机制,在比特币系统中,工作量证明主要通过计算来猜测一个随机数(nonce),使它拼凑交易数据后的内容的Hash值满足哈希值前N位为0的个数。由于Hash值在数学上主要采用群举法碰撞所得,需要进行大量的计算,只要能提出满足要求的随机数的矿工就被认为付出了一定的工作量,可以获得除了与新区块相关的奖励之外,还可以得到区块中包含的所有交易付出的交易费。POW共识机制创造了可以在完全不信任环境下参与者仍然可以达成共识的方案。从比特币来看,POW存在明显缺陷,首先是需要大量的算力,造成资源浪费;其次是长达10分钟的交易确认时间使其不适合上链频繁的系统。3.2.2RaftRaft共识算法是工程上使用较为广泛的强一致性、去中心化、高可用的分布式协议。Raft机制是相同的初识状态+相同的输入=相同的结束状态。Raft会先选举出leader,leader完全负责replicatedlog的管理。leader负责接受所有客户端更新请求,然后复制到follower节点,并在“安全”的时候执行这些请求。系统中只能有一个leader,如果一段时间内,发现没有leader,则大家通过选举投票选出leader,leader会不停地给follower发送心跳消息,表示自己存活,如果leader故障,那么follower会转为candidate,重新选举出leader。联盟链仅针对联盟成员开放全部或部分功能,所以联盟规则就是联盟链的权限机制。联盟链适用于机构间的信息共享,如交易、结算等场景。高校内部适合采用联盟链技术,而Raft就是联盟链中可采用的经典共识机制。但Raft算法并不严格保证抗欺骗性,无法应对非拜占庭错误,需要在其基础上进行优化设计。

3.3智能合约

尼克•萨博最早于1994年提出了智能合约,他定义道:“一个智能合约是,一个计算机化的交易协议,它执行一个合约的条款。智能合约的设计目标是,执行一般的合同条件,最大限度地减少恶意和意外的状况,最大限度地减少使用信任中介”。他认为,智能合约的目标是,用事先确定的代码自动执行合约条款,无须人工干预和第三方中介。智能合约中的“智能”,就意味着自动化、可编程。智能合约的出现,使区块链不仅能处理简单的转账功能,还能实现复杂的业务逻辑,极大地推动了区块链技术发展,加速应用落地。基于区块链的分布式应用DAPP的底层技术就是“区块链+智能合约”。第一个结合了区块链与智能合约技术的平台——以太坊的诞生,被认为是开启了“区块链2.0”时代。智能合约能在联盟链中实现逻辑与数据的分离,用来实现系统应用层面的功能。

4系统实现

高校区块链系统中,参与者为各个部门,由于高校组织架构相对稳定,所以将采用联盟链技术为主,结合私有链技术,提供有效的技术手段确保数据在具有共同目标但是相互之间不完全信任的各部门之间共享。高校区块链系统将基于区块链技术的高校数据系统分为四层展开研究与建设,分别为访问层、应用层、服务层和平台层。(1)访问层主要面向智慧校园建设的各个业务系统,业务系统通过高校数据系统中获取所需的全域数据,避免从多个业务部门进行数据对接所存在的数据冲突、数据时效性、数据格式不统一等问题。(2)应用层是面向各个部门,提供用于各部门维护上链数据以及制定数据访问策略等功能。包括各部门按照系统指定的数据规范进行上链数据的标准化操作,指定哪些部门有数据的访问操作权限,查看数据操作日志等。(3)服务层是根据我校及各部门政策要求研发不同的智能合约,为数据的共享交互建立自动化处理机制,避免人工参与的不安全性与出错率,降低人力成本。(4)平台层是提供共识机制、智能合约、数据存储、加密技术等区块链基础服务能力,平台层用于保障数据的传输与访问安全,在各部门之间建立信任关系,为数据提供存储功能等。

5结论

本文研究了利用联盟链技术解决高校内全域数据进行数据共享的问题。通过将各部门的数据上链,然后利用智能合约控制数据访问与应用,解决了现在存在的通过excel等文件拷贝、部门数据随意篡改、中心化的数据中心、基础数据重复采集等问题。基于联盟链构建的高校智慧校园数据共享平台,可以实现不同部门、不同应用系统之间的数据共享,消除数据孤岛、数据资源浪费等问题。最终使得学校的所有数据资源能够实现互联互通,数据资源得到充分的共享和利用。

参考文献:

[1]单康康,袁书宏,等.区块链在高校信息化建设中的应用研究[J].中国教育信息化,2021(03):36-39.

[2]汪炜.智慧校园环境下高校信息化教学模式探究[J].教育信息化论坛,2021(12):29-30.

[3]刘李飞.智慧校园背景下高校数据共享的应用研究[J].信息通信,2020(06):109-111.

[4]蔡磊,朱燕超等.面向区块链的高效物化视图维护和可信查询[J].软件学报,2020,31(03):680-694.

作者:祝恒恒 徐俊 么冰 单位:徐州工程学院