智能搜索引擎在商业银行大数据中的应用

时间:2022-10-13 10:23:24

智能搜索引擎在商业银行大数据中的应用

摘要:本文针对商业银行大数据中使用的目录式搜索、关键词搜索和模糊搜索自身存在的缺陷,阐述了基于自然语言智能搜索引擎应用于商业银行大数据搜索中的理论价值和实用价值,以及商业银行应用的可行性、原则和方法途径。

关键词:智能搜索;商业银行;大数据

大数据是商业银行的历史记忆,保存的目的是为了利用。如何在浩瀚的大数据中快速、准确查找利用是一个重要科研课题。随着计算机在商业银行的应用,数据信息已经实现了从手工查找到计算机获取,极大地提高了查找利用效率。但由于目前使用的目录式搜索、关键词搜索和模糊搜索都存在很大缺陷,不能满足快速准确查找利用大数据的需要。因此,本文仅在提高大数据搜索速度和准确率这个层面上,阐述基于自然语言的智能搜索引擎应用于商业银行的理论价值和实用价值,以及商业银行应用的可行性、原则和方法途径。

一、商业银行大数据检索存在的缺陷

目前,商业银行使用的搜索工具主要是目录式搜索、关键词搜索和基于关键词组合模糊搜索。

(一)目录式搜索的缺陷是完全依靠手工操作,效率低速度慢

目录式搜索是一些管理软件自身携带的一种目录导航,是以人工方式或半自动方式建立起来的。目录的用户界面是分类结构,提供几个类的入口,逐级向下查询或者复合查询,直至找到需要的类别和结果,其过程需要若干个手工步骤。用目录导航可以找到需要的数据信息,其缺陷是完全依靠手工操作,需要人工按照分类一层一层填写,逐层进入,耗时费力,工作效率非常低,检索速度非常慢。

(二)关键词搜索的缺陷是信息过载

基于关键词搜索在搜索速度上克服了目录式搜索的缺陷。但使用关键词搜索,必须先在脑子里思考一下,想出一个清晰的关键词,即要搜索什么?给出的关键词准确,搜索结果才可能准确。否则,执行搜索以后返回的信息过多,相关信息和无关信息混杂在一起,必须从结果中逐一进行筛选。可谓你要一点水,它给你一条河甚至一片海,让人耗费的时间无法接受。要减少信息过载,就需要输入多个关键词进行渐进式查询,让人感到使用不方便。

(三)关键词组合模糊搜索的显著缺陷是漏检和准确率低

模糊搜索是建立在关键词搜索理论基础上的同义词搜索,只要输入关键词,该关键词的所有同义词信息都被搜索出来,没有人能够看得完。测试表明,只使用一个关键词模糊搜索,出现信息过载问题;如果输入关键词组合,由于受中文分词语料库的局限,必定存在信息漏检的问题。如果搜索一个信息,需要一次又一次的输入多个关键词才能找到结果,有时还找不到。因此,模糊搜索在应用方面不能满足使用者的需求。

二、商业银行应用智能搜索引擎的理论价值

智能搜索引擎把自然语言和人工智能、云计算服务理论高度融合,使搜索过程由传统的关键词匹配提升为内容概念相互关联的匹配,从而弥补了仅表达形式匹配所带来的种种缺陷,使用者不必再拘泥于关键词、标题、作者、时间、分类等传统搜索方法,可以直接基于自然语言搜索,即搜即得。智能搜索引擎开创了一种新型的全文搜索方式,应用于商业银行大数据搜索的理论价值是:基于自然语言搜索,智能返回搜索结果。包括但不限于以下诠释:

(一)简便

人们在日常生活和工作中的交流是用自然语言而非关键词,与目录式搜索、关键词和模糊搜索相比较,基于自然语言搜索的优势,在于人机交流更加符合语言习惯,像人与人之间的交流一样直接、轻松,简便,这无疑给用户带来巨大的便利。

(二)智能

智能搜索引擎采用全信息智能匹配方式,可以直接以自然语言输入一句话或一段文字,甚至可以直接输入一篇文章作“关键词”进行搜索。搜索过程是一框式完成,已经远远超出了搜索框理论和应用的限制。

(三)快速

智能搜索引擎在百万级(每份为1000字以内)信息中的搜索响应速度为毫秒,并行访问的用户数量不受限制,使用户与其所需要的准确信息之间的距离只有点击一下鼠标那么远。

(四)准确

传统搜索引擎的查全率和查准率不能两全其美,查全率高时,查准率低;查准率高时,查全率低。智能搜索引擎采用自动分类聚类、自动过滤技术,自动过滤掉相关度较低和无用的信息,查准率可以达到95%以上,查全率100%。

(五)安全

智能搜索引擎内设安全机制,可以有效整合提取各数据源的数据权限,然后赋予到不同的文档和对象上,按照使用者权限动态配置权限,显示结果,保证密级信息按身份使用,不泄密。还可以根据需要设置其它安全控制功能。

三、商业银行应用智能搜索引擎的实用价值

商业银行应用智能搜索引擎的实用价值主要体现在:

(一)应用的可行性

智能搜索引擎可以使用现有的服务器等基础设施设备,不需要丢掉现有的设备,重新投资购置新的设备。尤其不涉及系统兼容性、稳定性和数据安全性等相关技术问题。从使用者的角度看,尽管目前使用传统搜索已经习惯了,但更希望使用智能搜索引擎,因为它快捷简便,正如美国《连线》杂志主编,克里斯•安德森所说,“搜索引擎的诞生,极大缩短了人们查找信息的时间,最大化的提升了人们的工作效率。”如果把目录式、关键词搜索比如是固定轨道上的一列火车,那么智能搜索引擎就像一架飞机,它能朝着无数个方向前进,还能根据需要改变目的地。可见,其应用势在必行,是大势所趋。

(二)应用的稳定性

商业银行应用智能搜索引擎的基本原则是,不改变现有的外网、内网和网上办公等系统,在继续保留现有的多种搜索工具和查询方法,不影响现有系统的稳定性与可靠性和存储能力与计算能力的基础上,增加一个“智能搜索服务平台”,使商业银行传统与先进的多种搜索工具并存共舞,优势互补,切实实现大数据信息搜索简便、快速、准确。

(三)应用的简便性

智能搜索引擎可以连接商业银行内多个信息源同步搜索,是可以定制的内部大数据搜索利器。在一个银行内,可以应用智能搜索引擎把大数据信息、资料、内网、外网等多个应用系统链接在一个应用平台上,以云计算网络化服务方式实现无缝链接、互联互通、资源共享与自由转换。使用方法非常简便,各种查询都统一使用一个搜索框,以自然语言输入关键词,或者文档的中心思想,或者印象较深的内容,一站式完成搜索,智能返回搜索结果,省时省力,即搜即得。综上所述,智能搜索引擎应用于商业银行大数据搜索,对于提高大数据的查找速度、查全率和查准率,对于充分发挥大数据的作用,对于跨时间和空间界限更大范围实现大数据互联互通、资源共享等方面,都具有十分重要的意义,必将备受关注,广泛应用。

作者:宫伟 单位:中国工商银行运行管理部