金融数据可视化应用和探索

时间:2022-07-13 09:08:20

金融数据可视化应用和探索

摘要:随着金融数据容量和复杂度的不断提高,使得用户对金融数据的分析和理解产生了一定的困难。进行金融数据可视化研究已成为金融市场的一个重要需求。本文基于Python可视化技术,进行金融数据可视化实例分析,并提出了金融数据可视化分析应用模式。文中实例生成对应的可视化图形,用更直观的方式对金融数据进行多维度展示并加以分析。研究结果表明,在金融数据分析中应用可视化技术可以让研究人员和用户迅速地洞察数据的内涵和价值,为进一步决策分析做出有利的技术支持。

关键词:金融数据分析;可视化;Python;可视化库;应用模式

1引言

目前,大数据技术已经覆盖至社会生产和生活的各个领域,数据科学带来了新一轮科技革命和产业变革的机遇。经济金融领域是“数据金矿”。随着大数据技术的发展,金融行业需要结合数据科学和金融业务进行创新,整合结构化和非结构化数据,挖掘和分析客户的消费信息,预测客户的行为和消费习惯,从而提高金融行业服务的效率。基于大数据技术,金融机构已在客户画像、精准营销、业务审批、融资授信、风险防范和量化交易等领域取得较好的效果[1]。随着数据科学和计算机存储技术的发展,金融数据的产生和存储量与日俱增[2]。在美国银行(BankofAmerica,BOA)等一些金融机构中,每天都会处理成千上万条的电子转账[3]。随着这些金融基础数据量的不断增大,金融数据研究者和分析人员通过单纯查看数据表格分析方式已经捉襟见肘。普通用户想通过金融数据进行投资和理财分析更是一筹莫展。而可视化技术对于处理金融数据有着得天独厚的优势,可以帮助人们对海量、多维的金融数据进行分析,使得人们能够以相对直观快速的方式对数据传递的信息加以理解,进而为这些信息创造价值提供技术支持。本文主要研究可视化技术在金融数据的应用优势,首先基于Python中的可视化库对金融数据实例进行可视化设计,然后对可视化的结果进行进一步的研究分析。

2技术路线研究

2.1可视化技术研究现状

面对海量、高维、多源和纷繁复杂数据的分析挑战,可视化技术把数据挖掘技术、科学可视化、计算机图形学和人机交互等方法结合起来,并将人眼作为一个并行处理器,利用人眼的模式识别能力和感知能力对数据进行交互的可视化表达以增强认知。把不可见或难以显示的数据转化为可以感知的颜色、符号、图形等输入。研究新的可视化方法和理论模型,利用新的用户交互手段辅助其从复杂矛盾或不完整的数据中挖掘出的信息之间的关系和隐藏模式,从而为决策提供有效的支持[4]。随着全球范围内数据量剧增,数据可视化技术在生命科学、地理信息学、工业、军事等各个领域得到了广泛应用。近年来,它在网络安全、金融和商业智能等领域的数据可视化也被大范围应用,成为数据可视化中新的热点。目前国外学术界与工业界都沿着面向实际数据库、基于可视化的分析推理与决策、解决实际问题等方向发展。斯坦福大学提供了按需数据可视化Webinar[5]。在金融数据可视化领域,美国北卡罗莱纳州立夏洛特分校的可视化中心开发了基于识别特定关键词的电子转账数据可视化系统和构建了客户信用风险分析系统RiskVA[6]。在国内学者的可视化技术研究中,刘芳等提出一种基于引力场聚类的金融数据可视化方法[7],形成清晰的可视化聚类结果,发现数据变化规律。陈伟等采用R语言实现了基于大数据可视化技术的信息系统AC审计方法[8]。孙远波等利用疫情期间所的各阶段疫情数据可视化作品[9],分析出疫情可视化设计的用户分类、数据类型、特点和演化过程等。高莉莉等对中国知网(CNKI)检索的文献进行计量分析[10],运用Citespace软件对检索的相关文献进行可视化分析,绘制科学知识图谱。综上所述,可视化技术的研究已经取得了一定的成果,并在各个应用领域进行了实践。金融数据分析领域同样需要可视化技术的帮助和支持。

2.2Python可视化库简介

Python是目前最流行的程序设计语言之一。由于其简洁性和可扩展性,自2004年以来,使用率呈线性上升,目前已经稳定在编程语言前三名[11]。它的优势在于拥有丰富的扩展库,可以实现数据的可视化。常见的Python数据可视化库以matplotlib库和NumPy库为基础,还包括Pandas库、Seaborn库、Bokeh库等。本文中重点使用了两个基于Python的可视化库,具体如下:(1)Matplotlib库。Matplotlib是Python语言中可视化的基础库,具有十分强大和复杂的功能。它提供了一套和MATLAB类似的API,用户可以调用函数实现快速绘图和制表等功能。但相对而言,生成的可视化图表缺少鲜明的特点。(2)Plotly库。Plotly库是一款开源的绘图库,主要使用js进行图形绘制。实现过程中主要是调用Plotly的函数接口,底层实现完全被隐藏,便于初学者的掌握。而且生成的可视化图表可操作性强,便于进行多维数据的复杂性分析展示。

3金融数据可视化应用实例

3.1金融数据分析

数据分析是数据科学的一个核心研究方向。它是指将收集到的各类数据,采用一定原则和技术手段,进行清洗、计算、分析、加工处理的过程。金融数据是在各项金融活动中产生的数据。在金融部门开展的金融业务中产生的数据既是对其自身经营状况的客观反映,也反映了国民经济的宏观和微观运行。金融数据和金融数据处理具有自身的一些特征[12]。金融数据的数量巨大,信息来源广泛,主要来自金融机构内部的数据、市场的数据和全社会的数据。本文实例中的数据集来源于中国人民银行的调查统计司,属于来自社会的数据。在金融数据可视化设计流程中,首先通过各种设备和技术手段采集相关的数据;然后将采集的原始数据进行数据预处理;接着进行可视化映射,把不同数据之间的联系映射为视觉通道的不同元素;最后用户可以从数据可视化结果中提取有用信息。

3.2Python可视化设计实例

本文以中国人民银行调查统计司的2021年度中资大型银行人民币信贷收支表为例[13],进行金融数据可视化分析设计实例分析。其中数据的字段包括境内存款中的个人存款、单位存款、国库定期存款和非存款类金融机构存款。

3.2.1可视化饼图设计实例

饼图或圆环图是由面积大小不一或颜色填充的扇形组成的圆形图表,主要用于显示数据中各项与总和的比例。它可以用于快速展示数据中各项数据在整体数据中的占比情况。基于Plotly库绘制饼图使用Pie函数。绘制环形图时,在Pie函数中设置控制环形中心空白大小的hole属性即可完成。还有一类特殊的饼图被称为旭日图,是可以对各部分构成进行进一步分析比对的可视化图形,对数据的多维度、多层次分析很有帮助。现对2021年度中资大型银行人民币信贷收支表中一月数据进行可视化分析。把现有的数据进行预处理。首先用Plotly库绘制境内存款四种情况数据进行可视化设计,对境内存款的情况进行一个概括分析。境内存款情况如图1所示。从图中直观看到在2021年1月份,境内存款主要由单位存款、个人存款、非存款类金融机构存款和国库定期存款构成。其中个人存款达到509,840.27亿元,占比超过境内存款一半。单位存款的占比也较大,但相对于个人存款而言还存在一定的差距。非存款类金融机构存款所占的比例较小。而国库定期存款占比非常小,几乎可以忽略。这说明,从2021年的存款数据来看,个人用户倾向于保守的投资理财方案,因此个人存款数量巨大。而单位存款占比相对较大,主要是限于目前经济状况的不稳定期,持保守态度,没有进行大规模投入再生产,应该以活期存款的形式保持资金链的畅通。非存款类金融机构存款占比较小属于正常现象,保有一定的存款额度,大笔现金流应该出现在投资领域。国库定期存款占比非常小,是由于国家对各项发展的大力支持,支出较大,存款构成较小。接下来通过对境内存款中占比较大的个人存款和单位存款情况设计可视化图进行对比展示。境内个人存款和单位存款对比旭日图如图2所示。从图中可以看出,个人存款的数额大于单位存款。但在个人存款中,活期存款和定期存款数额差别不大,而单位存款中定期存款数额远远小于活期存款。这进一步验证了图1的分析结论,个人存款按保守的理财方案以定期存款为主;为了保持现金流的周转,单位存款以活期存款为主。

3.2.2可视化直方图设计实例

上文中,旭日图对比了境内个人存款和单位存款的占比,这对于各构成部分的分层次对比一目了然。然而,为了更直观地比较两类存款相同构成部分的具体数值,本文基于Plotly库设计个人与单位存款对比直方图如图3所示。从图3中可以直观对比单位存款和个人存款在活期存款、定期存款、结构性存款和保证金方面的具体数据。其中,除保证金外,个人存款的其他三个分支层次均大于单位存款。由此可见,对于多构成部分数据的直接对比分析,直方图与旭日图一起使用,更能说明问题的所在,使得这部分的数据分析和对比更为清晰明确,展示效果更容易被人接受和理解。

3.2.3可视化折线图设计实例

折线图将数据标注成点,并通过直线将点进行连接,可以清楚直观地展示数据的增减趋势。在Python中使用Plotly库中的plot()函数可以绘制折线图。本文设计2021年度境内存款折线图如图4所示,以用来研究2021年度境内存款的走势和之间的关系。从图4可知,全部四种类型的境内存款在2021年度均趋于平稳状态,无大幅波动现象发生。其中,国库定期存款最为稳定,是严格按照国库管理的相关规定来执行的。非存款类金融机构的存款有轻微的波动,属于金融机构正常投资理财的行为,说明本年度内不存在突现的大规模投资风潮。单位存款在2月份时有明显下降,这与我国农历新年单位发放年终绩效奖金对应。其余时间相对平稳,说明年度的发展居于稳定状态。春节假期后,个人生活和经济状态回归常态,而相应的个人存款数额会在3月有所上升。因个人用户群体基数较大,整体情况在一年中会出现一些小幅波动。

4结论

本文结合金融数据的特点,基于Python语言的可视化库,以中国人民银行调查统计司2021年度中资大型银行人民币信贷收支表为例,进行了可视化分析设计,分别从不同角度对2021年度的存款数据进行可视化展示和细致的数据分析。这些可视化设计和分析能够使研究人员和普通用户更直观、快速地对金融数据进行分析和挖掘,以便得出有效的决策支持。综上所述,本文对金融数据进行的可视化研究和探索具有较好的应用价值和实际意义。

作者:罗孟华 王可 单位:贵州财经大学大数据应用与经济学院(贵阳大数据金融学院) 贵州财经大学信息学院