人脸识别的核心技术十篇

时间:2023-12-25 17:45:09

人脸识别的核心技术

人脸识别的核心技术篇1

还记得在2012年上映的电影《碟中谍4》中有过这样的场景:在茫茫人海的火车站,目标可疑人物一眨眼的功夫已经被认出,随即被特工盯梢,美女杀手迎面走来时,手机立刻发出嘀嘀的报警声,上面已经显示杀手的姓名和信息。看到这些场景令人不禁要问:这是真的吗?事实上,这些情景已不仅仅是电影中炫目的特技,人脸识别技术已经从一场科幻演变成为触手可及的现实。

生物人脸识别技术的兴起和瓶颈

众所周知,生物特征识别技术被列为21世纪对人类社会带来革命性影响的十大技术之一。比尔·盖茨曾经预言:生物识别技术将成为未来几年IT产业的重要革新之一。

传统的身份鉴定方法包括身份标识物品(如钥匙、证件、ATM卡等)和身份标识信息(如用户名和密码),但由于主要借助体外物,一旦证明身份的标识物品和标识信息被盗或遗忘,其身份就容易被他人冒充或取代。生物识别技术是通过计算机与光学、声学、生物传感器和生物统计学等高科技手段密切结合,利用人体固有的生理特性(如指纹、指静脉、人脸、虹膜等)和行为特征(如笔迹、声音、步态等)来进行个人身份的鉴定,因其与人体的唯一性和不可分离,因此比传统的身份鉴定方法更具精确、安全和方便性。

在我国生物特征识别领域中,相对比较成熟的是指纹识别技术。它始于上世纪80年代初,基本与国外同步,并因技术成熟而得到广泛的应用。而在静脉识别、人脸识别、虹膜识别等生物认证技术研究上,相对要滞后10年之多。以人脸识别技术为例,证件比对技术早在20年前已经实现,但在劣质图像(图像模糊、分辨率低、光线、表情、角度、遮挡物等)的识别技术上遭遇识别障碍,识别拒绝率高,导致人脸识别技术缺乏推广普及的现实意义。

人脸识别技术的革新突破

2012年12月12日,在山西省科学技术厅组织的科学成果鉴定会上,山西中科博杰科技有限公司自主研发的“基于云计算技术的高效人脸识别系统”获得鉴定专家组的高度赞许。经中国模式识别之父、中科院院士戴汝为率领的专家组评议后一致认为该项目在同类研究中整体系统的水平达到国际先进水平,低质图像模糊图像复原技术达到了国际领先水平(科技成果鉴定证书编号:晋科鉴字[2012]第308号)。这是目前国际和国内对人脸识别大型系统鉴定评估的最高赞誉。

“基于云计算技术的高效人脸识别系统”具有超强的劣质图像兼容性,其独有的小图像、模糊图像重建功能,支持肉眼不可分辨的模糊图像的重建,可以宽幅适应年龄变化、胖瘦变化、疾病变化、模糊图像的识别,使人脸识别技术取得了革命性的突破。因此,该系统获得了太原市2012年优秀科技项目一等奖、2013年第十七届中国国际软件博览会金奖、2013中国十大创新软件产品的殊荣。通过公安厅反恐局严格的同行比拼测试赛,该系统荣获国内同行测试第一名,比对效果领先第二名40%。

“基于云计算技术的高效人脸识别系统”实现了1.2亿次/秒的比对速度,高出2012年世界人脸识别最快速度3600万次/秒3倍,超强的劣质图像兼容性及高速比对效率,使人脸识别具备了广泛应用和推广的基础。

早在2008年北京奥运会上,公司核心团队就担当了北京奥运会人脸识别票证安全系统的研发、设计与实施的重任,将人脸识别票证实名制系统成功应用于奥运主场馆国家体育场鸟巢开幕式检票通道。

“基于云计算技术的高效人脸识别系统”实战效果已经显现,在武汉沿河大道拎包案、南京特大持枪抢劫杀人案、天津蓟县黄金抢劫案、内蒙古特大杀人案、太原某洗浴中心失窃案等十余起案件的破获和证据提供上发挥了关键作用,在广东湛江市户口清理整治中,查出双重或虚假户口6912个,抓获网上逃犯3名。

该项人脸识别技术是我国人脸识别技术的革新性突破,已达到国际人脸识别尖端技术水平。

山西中科博杰科技有限公司与中国科学院自动化研究所联合组成战略联盟,同时以与太原市公安局、太原理工大学共建的实验室为强大技术后盾,成立院士工作站,不断创新,为维护国家和社会稳定,为全国公安系统提供最优质的服务。山西中科博杰科技有限公司坚持以公安业务的重大科技需求为导向,以公安及行业实际应用为目标,以体制与机制创新为抓手,以提高科技创新与成果转化能力为重点,加强科研基础条件建设和科技资源整合力度,努力把公司建设成为科学研究、人才培养、学术交流的产业化基地,为全国公安业务工作提供技术与服务支撑。

人脸识别技术未来发展重点

山西中科博杰未来的发展目标要瞄准视频监控数据的采集和后台分析,每年加大研发投入力度,确保在国际国内技术持续领先的优势,在已经建设完成的人脸识别系统平台的基础上实现衍生和拓展应用,在视频侦查数据分析上满足公安系统业务的大量需求,将模糊图像复原,微图像重建技术深入优化,推广成为未来公共安防的重要手段。

为了能够扩大产业化成果,提高市场占有份额,实现该项目技术在各个领域的广泛应用,公司将以山西作为总部基地,面向全国战略发展,将知识产权和产品的研发生产基地放在太原,设立以太原为中心面向全国的工程技术中心,成立以太原为核心的华北技术中心、以南京为核心的华东中心、以成都为核心的西南技术中心、以西安为核心的西北技术中心、以北京为核心的覆盖东三省内蒙天津等地的技术中心和以深圳为中心的华南技术中心,整合完成基于云计算技术的人脸识别全国大平台。

人脸识别的核心技术篇2

关键词:生物识别;微控制器;Blackfin;MSA

引言

生物特征识别技术是指利用人体固有的生理特征或行为特征来进行个人身份鉴别认证的技术。生物特征识别技术包括采用人体固有的生理特征(如人脸、指纹、虹膜、静脉)进行的身份认证技术和利用后天形成的行为特征(如签名、笔迹、声音、步态)进行的身份认证技术。与传统的身份鉴定手段相比,基于生物特征识别的身份鉴定技术具有如下优点:(1)不会遗忘或丢失,(2)防伪性能好,不易伪造或被盗,(3)“随身携带”,随时随地可用。正是由于生物特征身份识别认证具有上述优点,基于生物特征的身份识别认证技术受到了各国的极大重视。

生物特征识别技术及其发展趋势

目前,常用的生物特征识别技术所用的生物特征有基于生理特征的如人脸、指纹、虹膜,也有基于行为特征的如笔迹、声音等。下面就这些常见的生物特征识别技术的特点及其发展趋势作一简单介绍。

人脸识别

人脸识别作为一种基于生理特征的身份认证技术,与目前广泛应用的以密码、IC卡为媒介的传统身份认证技术相比,具有不易伪造、不易窃取、不会遗忘的特点,而人脸识别与指纹、虹膜、掌纹识别等生理特征识别技术相比,具有非侵犯性、采集方便等特点。因而人脸识别是一种非常自然、友好的生物特征识别认证技术。

人脸识别技术包括图像或视频中进行人脸检测、从检测出的人脸中定位眼睛位置、然后提取人脸特征、最后进行人脸比对等一系列相关的技术。

最早的人脸识别系统建成于20世纪60年代,该系统以人脸特征点的间距、比率等参数作为特征,构建了一个半自动的人脸识别系统。此时的人脸识别研究多集中于研究如何提取特征点进行人脸识别,如人脸特征器官(眼角、嘴角、鼻孔)的相对位置、大小、形状、面积及彼此间的几何关系等。由于这些特征点难以准确定位、鲁棒性差,因而采用这些方法的人脸识别系统的性能都很低。

自20世纪80年代开始,人脸识别技术出现了基于面部图像的方法。与基于特征点的方法相比,基于面部图像的方法不是提取人脸特征器官这一高层特征,而是将人脸作为一个图像整体,从图像中提取反映人脸特性的特征如DCT变换特征、小波特征、Gabor特征等等。基于面部图像的方法由于利用了更多的底层信息,以及统计模式识别方法的引入,使得这类方法具有非常高的识别率和非常好的鲁棒性。由于基于面部图像的人脸识别算法具有很高性能,目前已经出现了不少推广人脸识别技术的厂商,如国内的北京海鑫科金高科技股份有限公司、国外的LIID等。

为了评测基于面部图像的人脸识别算法的性能。美国ARPA和ARL于1993年至1996年建立了FERET数据库,用于评测当时的人脸识别算法的性能。共举行了三次测试FERET94、FERET95、FERET96。FERET测试的结果指出,光照、姿态和年龄变化会严重影响人脸识别的性能。

FERET的测试结果也表明了基于面部图像的方法的缺点。人脸是一个三维非刚体,具有姿态、表情等变化,人脸图像采集过程中易受到光照、背景、采集设备的影响。这些影响会降低人脸识别的性能。

为了克服姿态变化对人脸识别性能的影响,也为了进一步提高人脸识别性能,20世纪90年代后期,一些研究者开始采用基于3D的人脸识别算法。这些算法有的本身就采用三维描述人脸,有的则用二维图像建立三维模型,并利用三维模型生成各种光照、姿态下的合成图像,利用这些合成图像进行人脸识别。

2000年后,人脸识别算法逐渐成熟,出现了商用的人脸识别系统。为了评测这些商用系统的性能,也作为FERET测试的延续,美国有关机构组织了FRVT2000、FRVT2002、FRVT2006测试。测试结果表明,人脸识别错误率在FRVT2006上下降了至少一个数量级,这种性能的提升在基于图像的人脸识别算法和基于三维的人脸识别算法上都得到体现。此外,在可控环境下,虹膜、静态人脸和三维人脸识别技术的性能是相当的。此外,FRVT2006还展现了不同光照条件下人脸识别性能的显著提高,最后,FRVT2006表明人脸自动识别的性能优于人。值得一提的是,清华大学电子工程系作为国内唯一参加FRVT2006的评测的学术机构,其人脸自动识别性能优于人类。

FRVT2006为人脸识别后续的研究指明了方向,人脸识别中光照、年龄变化依然对人脸识别性能有很大影响,二维人脸识别的性能不比三维人脸识别差。

指纹识别

指纹识别技术是指通过比较不同人指纹中的特征点不同来区分不同人的身份。指纹识别技术通常由三个部分组成:对指纹图像进行预处理。提取特征值,并形成特征值模板。指纹特征值比对。

指纹图像预处理的目的是为了减少噪声干扰的影响,以便有效提取指纹特征值。常用的预处理方法有图像增强、图像平滑、二值化、图像细化等。

特征提取的目的就是从预处理后的指纹图像中,提取出能够表达该指纹图像与众不同的特征点的过程。最初特征提取是基于图像的,从图像整体中提取出特征进行比较,但该方法的精度和性能较低。现在一般采用基于特征点的方法,从图像中提取反应指纹特性的全局特征(如纹形、模式区、核心区、三角点、纹数等)和局部特征(如终结点、分叉点、分歧点、孤立点、环点等)。得到特征点后就可以对特征点进行编码形成特征值模板。

指纹特征值比对就是把当前获得的指纹特征值与存储的指纹特征值模板进行匹配,并给出相似度的过程。

虹膜识别

虹膜相对而言是一个较新的生物特征。1983年,Flom与Safir申请了虹膜识别专利保护,使得虹膜识别方面的研究很少。1993年,Daugman发表了关于虹膜自动识别算法的开创性工作,奠定了世界上首个商业虹膜自动识别系统的基础。随着Flom和Safir专利在2005年的失效和CASIA及ICE2005中虹膜数据集的提供,虹膜识别算法的研究越来越蓬勃。ICE2006首次对虹膜识别算法性能进行了测试。

虹膜识别中需要解决如下两个难点问题:一是虹膜图像的获取,二是实现高性能的虹膜识别算法。

生物特征识别产品的发展趋势

生物特征识别产品逐步从单一PC处理,

转变为分布式计算。用独立的前端独立设备来完成生物特征的采集、预处理、特征提取和比对,而用中心PC或服务器完成与业务相关的处理。阐述这种方式较之传统方式的优点一由于前端采用嵌入式设备,因而自然提出了对数字信号处理器的要求。

生物特征识别技术对数字信号处理的挑战

为了获得更好的性能,研究者们从算法上、应用厂商从应用上对生物特征识别技术进行改进。这些算法根据不同生物特征的特点,采用新的数学模型,有效解决了现有算法的不足,使得生物特征识别技术性能上了一个新台阶。新的数学模型,较之以往的模型更为复杂,计算量更大。为了能够有效的在数字信号处理器上实现这些算法,要求数字信号处理器有更强的处理能力。我们下面结合人脸识别具体说生物特征识别技术对数字信号处理的挑战。

传统数字信号处理中核心算法之一就是傅立叶变换,该变换在通信、图像传输、雷达、声纳中都有很大的作用。但是,在相当长的时间里,由于傅立叶变换的计算量太大,即使采用计算机也很难对问题进行实时处理,所以并没有得到真正的运用。直到傅立叶变换的快速算法即快速傅立叶变换发现后,傅立叶变换的运算量大大缩短,从而使傅立叶变换在实际中得到了广泛的应用,也使得在数字信号处理器上实现傅立叶变换成为了可能。

尽管傅立叶变换对数学、物理产生了深远的影响,但对于大多数应用例如人脸识别而言是远远不够的。比如说人脸图像中,眼睛所含有的信息较其他部分对识别而言非常重要,需要找到一种方法,提取出眼睛这部分重要的信息,并尽量降低不重要的信息对识别的影响。这就需要对人脸图像进行局部分析。然而,傅立叶变换无法进行局部分析,使得傅里叶变换在人脸识别中的应用很有限。

为了提高性能,研究者将数字信号处理领域中新的复杂的变换如Gabor变换、小波变换引入人脸识别中,采用这些变换进行局部分析,提取出对人脸识别有用的特征,从而大大提高了人脸识别的性能。然而,Gabor变换和小波变换的计算量较之傅立叶变换而言非常大,为了在嵌入式设备上实现人脸识别系统,需要高主频、高性能的数字信号处理器来实现,这就对数字信号处理器的设计提出了一个很大的挑战。

从应用角度而言,为了良好的交互性,在实现人脸识别系统时,要求实时实现从视频采集到人脸识别全过程完成(或者至少在1~2秒钟内实现),否则,给人的感觉就不自然、不流畅。因而,从良好的交互性角度而言,在嵌入式设备上实现人脸识别系统需要高性能的数字处理器。

ADI公司的Blackfin系列处理器是一类专为满足当今嵌入式音频、视频和通信应用的计算要求和功耗约束条件而设计的新型16~32位嵌入式处理器。Blackfin处理器基于由ADI和Intel公司联合开发的微信号架构(MSA),它将一个32位RISC型指令集和双16位乘法累加(MAC)信号处理功能与通用型微控制器所具有的易用性组合在了一起。这种处理特征的组合使得Blackfin处理器能够在信号处理和控制处理应用中均发挥上佳的作用―在许多场合中免除了增设单独的异类处理器的需要。该能力极大地简化了硬件和软件设计实现任务。

目前,Blackfin处理器在单内核产品中可提供高达756MHz的性能。Blackfin处理器系列中的新型对称多处理器成员在相同的频率条件下实现了性能的翻番。Blackfin处理器系列还提供了低至0.8V的业界领先功耗性能。对于满足当今及未来的信号处理应用(包括宽带无线、具有音频/视频功能的因特网工具和移动通信)而言,这种商性能与低功耗的组合是必不可少的。

Blackfin处理器具有如下特点:

高性能处理器内核。Blackfin处理器架构基于一个10级RISCMCU/DSP流水线和一个专为实现最佳代码密度而设计的混合16/32位指令集架构,该架构很适合于全信号处理/分析能力。这种架构,使得人脸识别中的复杂的数字信号处理运算在Blackfin上很容易实现。

高带宽DMA能力。人脸识别中需要对图像块进行操作,这就涉及到内存数据存取。采用Blackfin的DMA控制器可以自动数据传输,所需的处理器内核开销极少。这样可以将宝贵的处理器的运算能力用于人脸识别的计算,减小数据存取对性能的影响。

・视频指令。人脸识别中最常进行的操作就是对像素值进行处理,Blackfin处理器具有对8位数据以及许多像素处理算法所常用的字长的固有支持,大大提高了人脸识别的处理速度。

・分层存储器。Blackfin具L1 Cache和L2Cache两级Cache,由于Cache较之外部存储器具有更快的存取速度,因而,在人脸识别时,可以把运算密集的代码放在L1 Cache或L2 Cache中,这样可以有效提高处理速度。

上述Blackfin处理器特点表明。Blackfin系列处理器非常适合处理需要高性能运算能力和高数据吞吐量的生物特征识别技术。

目前,Hisign已经将人脸识别的算法移植到ADI的Blackfin上,性能正在优化中。请继续关注。

人脸识别的核心技术篇3

其实在央行下发个人征信牌照准备通知前一天,在国务院总理的见证下,腾讯微众银行1月4日放出了第一笔3.5万元的贷款。该笔贷款就通过人脸识别技术和大数据信用评级后,计算出贷款金额。

10年前,腾讯为了发展电子商务推出网络支付品牌财付通,目前,除了互联网支付机构财付通外,腾讯还推出了微信支付及手Q支付;网络借贷也已经由腾讯参股的微众银行、财付通团队和Q钱包团队推出了微粒贷和微证券;此外,腾讯在投资或参股一些金融业务。可以说,10年来腾讯一直在互联网金融领域进行摸索和尝试,其中征信是至关重要的一环。

早在两年前,腾讯就开始进行征信业务的探索,腾讯征信有限公司是隶属于腾讯集团的征信牌照主体机构,作为独立第三方提供面向个人客户的征信产品,与包括QQ、财付通等腾讯其他部门或子公司签订协议。

目前来看,腾讯征信的产品有反欺诈产品和信用评级产品。反欺诈产品包括人脸识别和欺诈评测两个主要的应用场景。人脸识别主要应用在身份核实的相关场景,目前已应用在腾讯的微证券等产品上。欺诈评测则是对客户的欺诈风险提供一个等级评估,等级越高提示欺诈风险越大。而信用评级产品是运用于手机Q Q的“7星”信用报告,亮星颗数越多代表信用越良好。

腾讯征信总经理吴丹把腾讯征信的优势总结为两点,数据和技术。“我们有很丰富的线上行为表现,我们可以拿不涉及隐私方面的数据来做用户的信用评估。在技术方面不仅有传统的统计分析的技术,也有一些新的深入学习的技术。”

我就是我,你就是你

信用风险的第一步是欺诈风险,必须先确认身份再评估其信用风险。金融机构原来的身份确认必须由审核的业务员当面验证,人脸识别身份验证提供了另外一种可能。腾讯征信的人脸识别主要包括扫描身份证、人脸识别鉴定和活体识别。

打开手机上的应用,系统通过OCR技术扫描二代身份证的正反两面,自动抓取用户身份信息;然后,用户将脸部对准屏幕上的人脸取景框,系统自动拍摄视频和照片;接着,用户面对摄像头,按照要求读出系统随机给出的一串数字。三步完成后,系统会给出摄像头前的人与身份证上是不是同一个人的判断以及评分。

据吴丹介绍,整个人脸识别的流程中,需要通过两个验证:一是生物活体检测,通过唇语和声纹等方式验证摄像头前是一个真实的人;二是人脸成像识别,把摄像头拍摄的照片、身份证照片,和公民身份证号码信息查询中心的照片进行相似度对比,判断是否同一个人。

腾讯的人脸识别技术由财付通和腾讯优图合作完成,财付通负责流程设计和金融等场景应用,优图团队负责照片比对基础技术。该项目在2014年年初提出,经过3个月推出第一个版本。此后,不断更新,今年初,总理考察微众银行看到的已经是成熟版本。

据世界人脸专业评测(LFW)评测,腾讯优图提交的在无限制条件下人脸验证测试识别准确率为99 .65%,打破了之前Facebook,Google等团队创造的纪录。

腾讯优图于2012年年初成立,是隶属于腾讯社交网络事业群的技术研发团队。QQ空间的照片标注、天天P图这些腾讯体系的图片比对应用都是这个团队的成绩。腾讯优图研发中心总监黄飞跃介绍,人脸识别技术能够应用的关键核心在于三点:图像识别核心技术能力、足够庞大丰富权威的图像样本数据库和广泛灵活便捷的应用场景。

目前,腾讯征信已经和公安部所属的全国公民身份证号码查询服务中心达成人像比对服务的战略合作,可以7×24小时接入公安部查询服务中心的数据库。另外,经过数年准备,腾讯采集标注了海量生活照训练样本数据,目前拥有全球最大的黄种人人脸模型训练样本库。

腾讯优图团队每天负责处理亿级数量的图片,并自创了深度学习的模型、框架,积累了海量的数据和训练的模型。开发模型应用时,训练样本经过脱敏处理,腾讯优图不需要知道这个人叫什么名字,手机号是多少,只知道这是他可以用来识别的照片。

据了解,人脸识别服务已经进入实际应用阶段,根据实际互联网金融场景测试,自拍身份证对比可以达到万分之一错误率以下,通过率95%以上。

社交数据贡献超预期

目前,腾讯拥有8亿QQ账户、超过5亿的微信账户、超过3亿的支付用户以及其他多种服务上聚集的庞大用户。腾讯征信的数据来源,涵盖了上述用户在线、财产、消费、支付、社交、游戏等情况。

2014年,美国政策与经济研究委员会(PERC)对于非金融信息在信贷决策中作用的研究初步发现,社交信息对于判断借款人的还款意愿和能力暂无预测力。但是腾讯通过数据挖掘和实际验证认为,社交数据的有效性可能会超出预期。

“社交有没有作用,在我们这已经不是问题了。”吴丹说,

吴丹举例说,借5000元或10000元,传统上的风险评估的方法非常有用,如果只借几百块钱,大家的还款能力基本都没有问题,发生违约的情况更多是在还款意愿上,这说明从过往的还款历史或者收入情况来说,风险评估的方法不一定那么有效。“我们在模型里加入社交的因素以后,对这个数据模型有20%到25%的提升,在针对小额的模型上面,社交的作用更大,基本上大部分都是社交方面的变量。”

吴丹介绍,人脸识别技术扫描用户身份证后,腾讯征信不仅可以得到身份证本身和公安部的数据,还可以知道其在腾讯体系内的QQ、微信等信息。腾讯通过财付通的第三方支付账户和绑定的银行卡账户,把用户的身份证、QQ、微信、手机号、银行卡、财付通账户多重信息进行了关联和匹配,得到任何一种信息,都可以关联到用户的其他信息。征信体系将利用大数据平台,在不同数据源中采集处理相关行为和基础画像等数据,并利用统计学、传统机器学习的方法,形成个人征信报告。

个人征信报告主要由用户在微信、手机QQ支付以及消费偏好;在腾讯产品内各资产的构成、理财记录‘财付通账户是否实名认证和数字认证;消费贷款、信用卡、房贷是否按时还等4个维度构成。其运用于手机QQ上将采取打星的形式,共7颗星,亮星颗数越多代表信用越良好。“采取星级而不是业内普遍的评分也是基于腾讯用户的实用习惯,他们更习惯星星钻石而不是具体分数。”吴丹说。

吴丹直言:“如果我们的征信评价与央行是一致的,这说明我们的信用风险评估是准确的;如果不一致,这也是我们的价值所在――提供了另一个独特的信用评估体系。”

人脸识别的核心技术篇4

“芝麻,开门吧!”这充满魔力的咒语,总能让人想起阿里巴巴与四十大盗的故事。强盗们保护财宝的方法神秘莫测,常令人满怀好奇。2008年8月8日,用于维护北京奥运会安全的人脸识别系统,在万众瞩目的中国国家体育场鸟巢上演了一场现代版的芝麻开门,吸引了全世界的目光。

据悉,人脸识别查询技术是由清华大学电子工程系承担的一项国家“十五”科技攻关课题。目前,该系统已建成拥有256万张人脸图像的人脸识别数据库,识别速度达到每秒256万张,即一张人脸图像在一秒钟内可以和256万张人脸――比对,轻松完成“你到底是谁”的核查。这一卓越成果的问世,让我们对它的开发者――我国著名图像处理系统专家、清华大学教授苏光大产生了浓厚的兴趣。

兢兢业业写春秋

早在1989年,苏光大教授带领课题组接受了公安部计算机人像组合系统的研制任务。1992年,研制成果通过公安部组织的专家鉴定,1993年由公安部组织推广应用。1994年。武汉市公安局利用这一技术破获了武汉持枪抢劫的特大案件,成为人像组合破获的首起成功案例,中央电视台《东方时空》等栏目及时进行了追踪报道。此后,课题组将人脸识别技术作为科研方向,付出了极大的努力。1996年,他们又承担了公安部的人像组合与人像识别综合系统科研课题。2000年12月,由他们研制成功的系统通过了公安部组织的专家鉴定。2004年,北京市公安局利用这一系统破获了著名的北京超市系列投毒案,为维护社会安全做出了突出贡献。

作为关键技术之一,人脸识别技术在防范打击重大刑事犯罪中发挥了不可替代的重要作用,因此,公安部将该技术的研究列入国家“十五”攻关计划。由于具有良好的专业素质和多年的实践经验,苏光大教授带领他的团队接受了这一科研重任。此后,他们沉醉于课题攻关中,不舍昼夜地拼搏。2005年1月,由他们研制成功的人脸识别系统通过成果鉴定。并于2006年1月参加了科技创新重大成就展,获得了有关领导和专家的好评。不久,新华社、中新社根据“清华人脸综合识别系统全面进入应用推广”的新闻稿发了通稿,上百家媒体相继进行了集中报道,不仅在国内外产生了较大影响,更推动了国内的人脸识别市场。由此,清华大学人脸识别系统成为国内应用的主流系统之一,在公安、安全部门广泛应用。2008年1月,他们在国内首次建成了千万级数据库的人脸识别应用系统,取得了突出的应用成果。

特别值得一提的是,2005年,苏光大教授发表了人脸识别与奥运的学术论文,表达了服务北京奥运会的愿望,并根据奥运会应用的特点,在已有MMP-PCA人脸识别算法的基础上,研制成功了GGMMP-PCA人脸识别新算法。这一研究成果于2008年发表在国际顶级的计算机视觉和模式识别会议CVPR上。经过多方努力,他们研发的系统在2007年8月、2008年5月两次参加奥运测试赛,并最终应用在北京奥运会、残奥会的开幕式和闭幕式上。由苏光大教授带领的清华大学课题组与北京普赛科技有限公司以及中科院自动化所、北京数字奥森公司和航天长峰集团、同方股份有限公司等单位通力合作,共同完成了这一具有历史意义的工作,开创了人脸识别技术应用于奥运会的先河。

“泰山不让土壤,故能成其大;河海不择细流。故能就其深。”苏光大深谙厚积薄发之道,带领团队兢兢业业,书写了我国人脸识别技术领域的精彩篇章!

风雨磨砺塑英才

回顾走过的道路,苏教授收获了累累硕果,更经历了无数风雨的磨砺。上世纪70年代,国内的图像处理技术研究刚刚开始,作为较早从事相关研究的科研人员之一,苏光大教授所在的团队面临着诸多困难。当时,国外的处理系统价格昂贵,国内根本买不起,只能自己研制。然而,国产器件质量不过关,他们在工艺上还需要一点点摸索,其艰辛可想而知。尽管条件有限,他们却没有放弃,而是选择了迎难而上,潜心钻研,在摸索中前进。1981年,中国较早的图像处理系统“TS-79小型通用数字图像处理系统”研制成功。其后,他们也引进过国外的器件,所开发的系统比国外的同类系统性能优越得多。一次次的成功给了他们巨大的信心。1985年,他们参与研制的“TS-84微机图像图形处理系统”获得成功,成为中国最早的微机图像处理系统,并于1988年荣获北京市科技进步二等奖。

“没有人能够随随便便成功”,事实的确如此,在苏教授的辉煌成果背后是无尽的艰辛与付出。工作起来,不分白天、黑夜,没有节假日,没有所谓的休息、锻炼,不知道看电视的乐趣,不知道唱卡拉OK的畅快,日日往返于实验室、食堂、家这三点一线之间,苏教授是这样的人,他的学生也是这样的人。他常常劝诫年轻人“业精于勤”,引导他们趁着年轻努力奋斗,书写多彩人生。学生们还清楚记得这样一件事。有一次,苏教授不慎被刚烧开的一壶水烫伤了双脚,他硬是不顾烫伤,用塑料袋裹住双脚,顶着大雨,坚持到实验室加班。这份于科研的情意,这份于事业的执著曾让他们深深震撼!苏教授在给毕业生的留言中这样写道:“抓住思想的火花,倾注创作的激情,百折不挠的努力,有声有色的体现。”这不仅成为学子们人生的座右铭,更被收入《中国名人格言》中,为更多人带去人生的启迪。

在2006年的科技创新重大成就展上,当时的科技部部长对苏光大教授和清华大学团队取得的成就大加赞赏。并询问项目的经费是多少,苏教授笑着回答:“国家拨款50万。”

是啊,这样的经费创造出这样的成果怎能不令人刮目相看。他开玩笑地说:“给我阳光,我就‘灿烂’。”当初人像组合系统仅一万多元的项目经费,他也为国家做出了令人惊奇的成果。苏教授说:“国家的事儿,没有大小之分,都是重要的事情。只要国家把任务交给了我们,我们就一定要做好!”在他心中,只要是国家需要的科研项目,他们都会殚精竭虑努力做到最好。

“苏教授,您的人脸识别系统又帮我们破了大案,我们对您表示感谢啊!”这样的电话苏教授已经司空见惯。每当这时,那些曾经的艰辛与付出他早都忘到了九霄云外,满心满脑子都是自己为维护国家安全和社会治安又尽了一份力,心中洋溢着无尽的喜悦与幸福。

“从明天起,和每一个亲人通信/告诉他们我的幸福/那幸福的闪电告诉我的/我将告诉每一个人。”谈起科研工作中的新发现,苏教授欣喜之情溢于言表,告诉我们他的心情就像海子在这诗中写的一样,他总是愿意和更多的人分享自己的喜悦,在不断地交流中更快地成长和进步。也许,正是这样的心态,成就了我们面前的这位图像处理专家。

人脸识别的核心技术篇5

以前,徐立布道“深度学习”、“人工智能”、“DeepMind”这些名词,客户常常不知所谓。谷歌(Google)旗下Deep Mind公司开发的人工智能程序AlphaGo击败韩国围棋高手李世石之后,客户纷纷主动询问合作机会,“PPT中的大量专业词汇,AlphaGo用5盘围棋全普及了”。

2014年,徐立和学术同行联合创立商汤科技,目前核心业务是机器视觉服务,包括图像视频的处理和理解、人脸识别,其技术基础就是与AlphaGo同源的深度学习。这家低调的创业公司,已在不知不觉中渗透进多数人的生活。

领先一步

对徐立而言,AlphaGo赢得比赛并不意外。

过去两年,但凡介绍深度学习,他都会谈及AlphaGo的“造物主”Deep Mind公司――2014年谷歌耗资4亿英镑收购的一家英国公司。“Deep Mind才12名员工,创始人是一位国际象棋冠军,没有具体产品,只从事深度学习的游戏研究,要花4亿英镑,当时业界震惊了。”

每与人谈及这宗收购,徐立听到的多数评价是“谷歌就会乱花钱”。然而,业内学术权威Yoshua Bengio教授当时评论:“深度学习领域内约有50名真正内行的专家,其中12人在Deep Mind,谷歌买的是未来。”AlphaGo证实了Deep Mind的价值。

所谓深度学习,某种意义上是对人脑神经细胞的模仿,人脑拥有大量相互联系的神经细胞,细胞间彼此传递神经刺激,而运算过程并非一步到位,是从一个层次到下一个层次计算复杂事物,用计算机模仿该过程,就形成深度学习,其本质是一种人工神经网络,擅长在大量数据基础上进行判断。

历史上,谷歌曾进行过一个“猫脸识别”的实验,建立一个有10亿个节点的神经网络,让其“观看”大量视频,人工大脑自主“学会”了识别猫脸的技能。此前没有预先编写任何程序告诉计算机什么是“猫脸”,完全通过海量视频和数据分析猫脸的特征。

深度学习的技术渊源,可追溯至上世纪80年代,受限于运算能力以及数据量,在学术界长期处于边缘地带。2006年后,由于IT技术的进步,其学派开始崛起;随后,微软人工智能首席科学家邓力(Li Deng)将其应用于语音领域,并取得重大突破,邓力及其合作者在2009-2010年间开发了一套算法,迅速将语音识别的准确率提高到一个新量级,一大代表性成果即全自动同声翻译系统,可实时把英文演讲翻译成中文并以中文语音输出。

“这项研究改变了人工智能的产业现状,引爆了学术界,深度学习马上成为大热点。”徐立评论说,“大量研究开始朝着深度学习方向迅猛推进,像推火车一样,技术应用不断拓展,计算准确率大幅度提升。”2013年,《麻省理工科技评论》(MIT Technology Review)将深度学习列为世界十大突破性技术之首。

据徐立介绍,深度学习目前主要应用于三大领域:语音识别、自然语言处理(代表性例子是“微软小冰”)以及计算机视觉。2010年前后,徐立当时是香港中文大学的博士后,与汤晓鸥教授等香港中文大学多媒体实验室的师兄弟多有接触,后者是深度学习在视觉领域应用的先驱。

其中,颇具说服力的成就是,在CVPR、ICCV和ECCV三大计算机视觉学术会议上,前3年有关深度学习的29篇文章中,有14篇出自香港中文大学多媒体实验室,其团队后来成为商汤科技的骨干研究力量。可以说,在深度学习与计算机视觉刚刚联姻时,正是学术方向的明智选择以及强执行力,成就了商汤科技现在的商业价值。

直到现在,商汤科技也保持着浓厚的学术色彩,其人才团队中有不少来自MIT、斯坦福、香港大学、香港中文大学、清华大学等高校及其实验室,以及谷歌、百度、微软、阿里巴巴等产业界的领军人物,其中包括5位微软研究奖获得者(Microsoft Research Fellow),两位A-star(阿里星人才计划),聚集了华人世界中一批深度学习和计算机视觉领域专家。200余人的公司中,拥有50多名博士。 全球人工智能市场规模

“商汤的很多科学家非常抢手,我们提供的工资并不比业界巨头高。”徐立向《二十一世纪商业评论》(下称《21CBR》)记者解释说,“这些科学家愿意过来,是因为我们真心相信,在人工智能这样的关键领域,中国原创科技完全有机会走到世界前列。”

全球第一

现就职于谷歌的Geoffrey Hinton被誉为深度学习领域的开山鼻祖,2010年在语音领域实现突破后,他尝试将深度学习引入到视觉图像领域,于2012年参加ImageNet竞赛。

ImageNet竞赛是人工智能领域的权威竞技场,斯坦福华裔学者李菲菲(Feifei Li)为视觉领域收集了大规模的“图像分类和物体检测”数据集。该数据集最初包括一个1000类图片分类的任务,后面又增加了200类静态图片物体检测任务。

Geoffrey Hinton第一次使用深度学习方法,就将图像分类的准确率提升10%,这在过往要耗时数年才能实现。此例一开,但凡在计算机视觉领域要证明自身实力,参加ImageNet竞赛几乎成必选项。

2014年9月,商汤科技联合创始人邱石博士等人首次出征ImageNet竞赛,在大规模物体检测比赛中以40.7%的成绩荣获世界亚军,成绩仅次于谷歌的43.9%。

2015年,ImageNet竞赛新增一项视频物体检测的任务。视频是连续的图像,比静态图像中的物体检测复杂度更高,商业价值也更高。举例来说,一旦将视频中的所有物件识别出来,品牌商就可按物体搜索,进行定向的品牌植入。

在该项新任务的比拼中,赛事主办方选择了30个类别的物体,商汤科技联合香港中文大学多媒体实验室组成的团队,在28个类别中准确率最高,第二名只赢了两个;商汤科技整体62%的准确率,也远高于第二名51%的准确率,最终商汤科技以11%的压倒性优势领先并夺冠。

按照徐立的解释,ImageNet比赛的成绩,取决于三大要素:

首先最核心的是“造脑”能力,脑子造得聪明与否,决定最后运算结果,造脑能力也是评价一家公司是否有人工智能核心技术的关键。谷歌收购Deep Mind团队,脸书(Facebook)招募学术权威Yann LeCun等人,百度聘请吴恩达(Andrew Ng)担任首席科学家,本质上请的就是“造脑的上帝”。只要人工网络的设计胜出一筹,在搜索等业务场景中将带来巨大的商业利益,而商汤科技研究团队的高占比,正是因为其将“造脑”列为第一要务。

其次是数据,数据量越大,运算结果越准确,由于ImageNet主办方也提供了限定的训练数据集,该项条件对于参赛者是平等的。

再次是超算能力,这是由大数据处理的需求所决定的,只有计算能力较别人快,才能测试更多的算法模型,从中遴选出最佳算法。商汤团队刚成立时,一开始没有GPU集群,往往要等1个月才能验证一个结果。在2014年5月,在吴恩达的主持下,百度构建了当时世界最快的超算平台MINWA,实现144个GPU连接。但现在,商汤科技已建设的深度学习超算平台DeepLink,200块GPU的连接为全国最大,以前耗时1个月的运算,现在只需5-6个小时即可完成。

ImageNet竞赛的夺魁,证明了商汤科技在两大领域的实力,“第一,我们脑子确实造得好;第二,超算平台能力强。”徐立相当自豪。

掘金“人脸识别”

深度学习过于抽象,对普罗大众而言,商汤科技最易理解的标签之一就是人脸识别技术。

2014年下半年,投资机构IDG主动找上门,游说香港中文大学多媒体实验室的骨干创业,徐立等人当时在业内已相当资深,为什么舍弃学术追求而创业呢?

“从学术上转换成工业应用,本身是一种责任。”徐立解释说,此前,香港警方曾向其团队寻求帮助:一些高速行使的逃逸车辆,监控录像过于模糊,希望他们恢复出逃车辆的信息,香港警方愿意为服务埋单。这种实践给予了团队巨大的成就感。事实上,计算机视觉领域的“四大天王”(即前文所述的Geoffrey Hinton、Yann LeCun、Yoshua Bengio、吴恩达)中,就有3位投身产业。

2014年10月,商汤科技团队正式成立。创业伊始,团队的主要精力是将学术成果转化为商业性解决方案,2015年上半年一直忙于深耕产品,而随着人脸识别以及图像处理的需求日渐旺盛,在2015年6月份,公司业务开始爆发性增长,商汤科技的商务团队起初不过四五人,在公司忙于接待问询的客户,直到2015年底,才开始有针对性地开发行业客户。现在商务团队的负责人此前任职IBM Watson Health 大中华区事业总监。

由于商汤科技主要从事B2B业务,多隐身于幕后,一直未为人所知,实际上,其服务客户量早已达亿级规模。

小米是其合作商之一。2015年8月小米推出操作系统MIUI7,其中的宝宝相册,正是联手商汤科技共同打造的新卖点。小米云服务负责人范典告诉《21CBR》记者,宝宝相册中采用的人脸识别技术,主要在于三个核心算法:一是检测图库中的同一张脸,二是识别这张脸的特征,三是聚类相同的脸孔。

“在这个过程中,我们要确保用户隐私,绝对不能泄露任何数据,这是个挺大的工作量。尽管我们自研算法,但希望做出来的产品是一流的,所以全方位评估了超过10家公司后,最后决定将‘人脸识别’,就是数据特征这部分交给商汤来做。”范典说。

在线金融搜索服务平台“融360”的CEO叶大清也告诉《21CBR》记者,人脸识别技术发展至今,系统识别准确率已经超过了人眼的识别。换言之,技术胜于人类识别。在叶大清看来,这正是金融行业所需要的――人工智能应用于金融行业,可进行反欺诈,识别骗子,提高效率,降低风险。

因此,2015年5月,融360联合商汤科技推出名为“天机”的风控系统,从用户身份认证、还款意愿和还款能力三个大维度,进行信用评分,再根据分值向放贷机构提出放款建议。 据称,分值足够的用户,申请5万元以下的小额贷款,10分钟便可完成审批,最快当天放款。

同时,叶大清认为,新技术是推动普惠金融发展的重要动力,“我们总说普惠金融,为更多人提供金融服务,这是普遍性;而价格降下来就是‘惠’。长期利用技术能降低贷款利率,这是毫无疑问的。从这个角度来看,人脸识别技术,大数据风控技术,有可能降低融资成本,提高融资效率,推动普惠金融发展,帮助更多需要金融服务的老百姓。”

在徐立看来,深度学习近几年之所以流行起来,在于它为行业提供了新的解决方案。“现在深度学习很强大,以至于一套解决方案可以适配到各个行业中去。它是一个万能钥匙。”

据徐立介绍,现阶段商汤科技主要布局以下几个领域:

第一大领域是移动互联网,其客户包括小米,华为Mate 8的智能人脸相册,美图公司的人脸检测器、人像美容等。之前刷爆朋友圈的图聊软件Faceu、Snow等,采用的也是商汤科技的算法。这些产品应用,每个均涉及千万量级以上的客户。

值得一提的是,商汤科技还与中国移动在线公司缔结了战略合作关系,后者实施的3亿用户实名制计划,就依托于商汤科技在OCR人脸识别领域的技术。

2015年中国移动全面实行实名认证,主要通过身份证OCR识别(Optical Character Recognition,光学字符识别),以及人脸识别两大技术实现。在去年中国移动的两项公开招标中,商汤科技最终在数十家竞标公司中胜出。

“在竞标过程中,商汤科技提供的技术模块有三个方面的特点:算法识别准确率最高;能够满足客户在不同场景下的图像识别;在最短时间内,利用数据针对实用场景开展了人脸识别训练。”中国移动在线公司实名制认证负责人王强鑫告诉《21CBR》记者。

王强鑫表示,通过人工智能技术完成身份核实和实名认证,不仅降低身份防骗防盗几率,解决了安全性问题,也因为系统自动处理服务,为客户带来很大的便捷性。王强鑫透露,后续与商汤科技合作中,计划在10086视频客服等其他数字服务领域全面应用刷脸识别技术,为客户提供更加便捷和安全的服务体验。

视频,正是商汤科技发力的第二大领域。2015年,商汤科技与安防企业东方网力共同设立公司,以视频监控系统、安防软件、大数据为基础,共同打造智能交通管理系统。

东方网力董事长赵永军表示:“视频技术作为视频的拓展,在平安城市中经过多年磨合,加上互联网技术的发展,视觉感知正在发生质变,技术和商业模式的探索将不断涌现出新的形态。”

的确,人工智能也为视频行业提供了新的模式和方案。今年年初,网络红人Papi酱火遍互联网时,再次推动了视频行业的发展。视频行业“新贵”小咖秀事业部总经理杨旭向《21CBR》记者透露,在多番评估测试后,小咖秀选择联手商汤科技,探讨如何结合人工智能,打造视频的新玩法。

商汤科技布局的第三大领域是互联网金融,其合作伙伴包括银联、京东金融、招商银行等,涉及真人检测、身份证、OCR等业务。

除了前文提及的融360,另一家合作伙伴“借贷宝”也采用了商汤科技的算法。借贷宝副总裁翁晓奇透露,其肖像认证系统采用了商汤科技的平台,用户不需输入银行卡密码即可进行身份认证,“在APP为用户肖像采集一张照片,再和公安部提供的身份证照片进行比对,我们每天有几十万人通过这种活体的肖像认证,目前是全国最大规模的肖像认证技术实践。”

人脸识别的核心技术篇6

关键词:PCA;人脸识别;算法

中图分类号:TP317.4文献标识码:A文章编号:1672-7800(2013)001-0054-03

0引言

考试仍然是当今教育体制中不可缺少的一个环节。为了更真实地反映考生的学习情况、检验教学成效,杜绝考生找“”进行替考等舞弊行为成为不容忽视的问题。身份鉴别技术是解决这一问题的关键。与传统的名字、密码等身份鉴别技术相比:生物特征识别手段的多样性,如指纹、掌纹、视网膜识别等,使之成为新兴的身份鉴别技术。由于生物特征的唯一性使得用生物特征作为身份鉴别依据的安全性、可靠性更高。在所有的生物识别技术中,指纹识别是最传统、发展最成熟的技术,但它需要被识别人主动配合,且获取识别信息需要时间,这给被识别人带来很大的不便。而人脸识别恰恰弥补了这些不足,其隐蔽性好、非接触采集和采集设备成本低等特点使之成为生物识别技术中的研究热点。人脸识别就其技术本质而言,是通过视频采集设备获取用户的面部图像,再利用核心的算法对其脸部的五官位置、脸型和角度进行计算分析,进而和自身数据库里已有的范本进行比对,最后判断出用户的真实身份。因此,采用人脸识别在考试中进行身份验证是切实可行的。利用人脸识别进行考生身份验证以代替传统的证件方式是有益的尝试。本文进行的是狭义的人脸识别研究,即将待识别的人脸与数据库中的人脸之间进行匹配的人脸鉴别。

1考试身份验证系统设计

考试身份验证系统流程框架如图1所示。在考生进入在线考试系统之前,由该系统先进行身份验证。首先由考生启动人脸识别客户端程序,驱动电脑摄像头(内置或外置)获得实时视频图像;根据捕获的视频图像定位人脸图像;经预处理来提高图像的品质,并将人脸图像设置成预先定义的尺寸;提取特征脸并在已有人脸图像数据库中进行查找、比对、识别;若能找出与客户端一致的特征脸则身份确认成功,并启动在线考试系统等待考生进入考试,否则身份确认失败,发出警报声引起监考人员警惕,考生暂不能进入考试,等待再次身份的确认(重复身份确认允许3次)。

图1考试身份验证系统流程

2基于PCA的人脸识别算法

在考试身份验证系统中,其核心实现部分就是人脸识别。人脸识别的方法很多,常用的有:几何特征识别、基于神经网络的识别、弹性图匹配的识别等。本文使用的基于PCA的人脸识别方法是基于图像灰度的统计特性,其基本原理为:利用离散KL变换提取人脸的主要成分构成特征脸库,在识别过程中将测试样本投影到该特征脸库中构成一组投影系数,通过与特征脸的距离比较,距离最小的特征脸对应的即是识别结果。在人脸识别中,若训练集是40幅不同的M×N大小的人脸图像。把图像中每一个像素看成是一维信息,则一副图像就是M×N维向量。由于人脸结构具有极大的相似性,且同一个人脸相似性更大,因此不采用像素来表达人脸,而是通过人脸来表达人脸。这就可以用PCA方法对40幅训练集图像进行处理,寻找这些图像中的相似维度。提取最重要的主成分后,让被识别图像与原图经过变化后的主元维度进行相似度比较,以衡量两幅图片的相似性。PCA人脸识别算法将训练过程重构获得的用于识别的样本称为“特征脸”,是一种通过降低维数提取特征的统计性模板比配方法对人脸进行识别的过程。PCA方法的算法如下:

第1步:将人脸图像处理为二维m×n灰度图像,并用N=m×n维列向量X表示。选取人脸图像训练样本集{Xi|i=1,…,M},其中Xi为第i个训练样本的图像向量,M为训练样本集总数。

第2步:计算训练样本的平均图像向量:μ=112M∑M12i=1Xi。

第3步:构造协方差矩阵:Ct=∑M12i=1(Xi-μ)×(Xi-μ)T。

第4步:求解协方差矩阵Ct的特征值和特征向量。直接计算的计算量比较大,采用奇异值分解(SVD)定理求解。

(1)令A=[X1-μ,X2-μ,…,XM-μ],则有Ct=AAT,通过求解ATA的特征值和特征向量获得AAT的特征值和特征向量。计算矩阵L的特征向量vl=(l=1,2,…,M)。

(2)计算出协方差矩阵Ct的特征向量μl=(l=1,2,…,M),使其满足:U=[μ1,μ2,…,μM]=[X1-μ,X2-μ,…,XM-μ]×

[v1,v2,…,vM]=AV第5步:取前d个最大特征值的特征向量计算特征脸。d由阈值θλ确定,满足:J=mind|∑d12i=1λi∑M12j=1λj>θλ3仿真实验结果及分析

一般图像的获取都是通过摄像头摄取,为了实验相对简单,不考虑通过摄像头摄取头像,而是直接给定要识别的图像。本文实验数据选自英国剑桥大学ORL人脸库。共选取40个人,每人10幅图像,图像的分辨率是112×92像素。每幅图像按列构成10304维列向量,选取每个人的前5幅图像构成一个训练集,即训练样本集数据为10304×200的矩阵,另外5幅图像构成测试集。设定阈值为0.9。

3.1实验环境

硬件配置:Intel(R)Core(TM)2DuoCPUE45002.20GHz,2GB内存。

软件:WindowsXPProfessionalSP3操作系统。利用MatlabR2010b编程实现。

3.2实验过程

第一步:读入训练样本图像,取每人(共40人)的前5幅图像,共计200幅,图像大小为112×92像素,部分人脸如图2所示。

图2部分人脸图像

第二步:对训练样本图像进行特征脸的提取。由于训练样本图像所对应的协方差矩阵为10304×10304的矩阵,直接求特征值和特征向量计算量太大,根据SVD理论求得协方差矩阵的特征值为一个1×200的向量。设定阈值为0.9,获得此时主要特征值个数为71个。将前71个主要特征值对应的特征向量组成线性变换矩阵(10304×71的矩阵):每幅训练样本图像向量进行线性变换后得到的主成分为1×71的向量,该向量经过线性变换反变换后得到的向量为1×10304,该向量构成训练图像的特征脸。特征脸示例如图3所示。

图3部分特征脸

第三步:读入剩余的图像(每人的后5幅图像)作为测试图像,40人,共计200幅,图像大小为112×92像素。将每幅测试样本图像向量进行线性变换后得到主成分为1×71的向量,该向量经过线性变换反变换后得到的向量为1×10304,该向量构成测试图像特征脸。

第四步:进行识别分类。分类器采用三阶近邻算法。最终得到的正确识别率为91.50%。三阶近邻法是计算出测试图像与训练图像距离最小的三幅图像,这三幅图像所属的类分别计为A、B、C,若A和B且B和C不属于同一类,则测试图像属于A;若A和B相同,则测试图像属于A,而B与测试图像也是相似的;若B和C属于同一类,则测试图像属于B,而C与测试图像也是相似的,但A虽然与测试图像距离最近却不属于同一类,可能是由测试图像的姿态和饰物引起的。

为测试训练人脸图像数目的多少对识别率的影响,对该40个人每人采用不同数目的人脸图像作为训练样本,得到的识别正确率如表1所示。

表1识别正确率比较

训练样本每人

图像数(幅)123124125126127128识别正确率(%)1280.001286.671291.501291.871294.171292.503.3实验结果分析

通过实验发现:PCA的识别率随着训练样本数目的增加,识别正确率逐渐提高,当超过一定训练样本数目时,识别率反而有所下降。

4总结与展望

本文通过对基于PCA的人脸识别算法的研究,得出如下结论:

(1)基于PCA的人脸识别方法算法通过降维的方法减少了计算量,降低了程序对计算机硬件的要求,同时识别的准确率较高,将该算法应用于考试身份验证中既简单又切实可行。

(2)本实验选自英国剑桥大学ORL人脸库,没有通过摄像头摄取头像,减少了考试身份验证中的图像预处理工作(包括人脸图像的定位、去噪等),该工作是完善考试身份验证系统中不可缺少的一部分。下一步工作拟采用VC++6.0作为工具平台,实现一个完整考试身份验证系统。

(3)传统PCA方法在处理人脸图像时,要将二维图像矩阵转换成一维的列向量,使图像的维数达到上万维,计算工作量大,特征提取速度慢。针对PCA算法的不足,有研究者提出了改进的PCA算法,例如:核主分量分析法(KPCA,KernelPrincipalComponentAnalysis)、二维主分量分析法(2DPCA,TwoDimensionalPrincipalComponentAnalysis)等,下一步有待在这些方面做进一步探索。

参考文献:

[1]李盛文,鲍苏苏.基于PCA+AdaBoost算法的人脸识别技术[J].计算机工程与应用,2010(4).

[2]郑晓薇,于梦玲.基于Matlab多核集群的人脸识别算法的并行化设计[J].计算机应用,2011(10).

[3]张俭鸽,刘洪波.WTPCA和三阶近邻的人脸识别算法仿真[J].计算机工程与应用,2009(11).

[4]王映辉.人脸识别原理方法技术[M].北京:科学出版社,2010.

[5]孙强,叶玉堂,邢同举,等.基于主成分分析法的人脸识别的探讨与研究[J].电子设计工程,2011(20).

[6]张俊虎,郝晓剑,邢昊.人脸图像识别中的PCA算法实现[J].微计算机信息,2010(19).

[7]于世华,杜福涛.基于人脸识别的上机辅助身份验证系统设计与实现[J].呼伦贝尔大学学报,2009(1).

[8]张成功.自动人脸识别在网上考试系统中的应用[J].大同大学学报:自然科学版,2009(3).

[9]马桂英.人脸识别技术的应用及研究趋势[J].福建电脑,2009(10).

[10]章品正,王征,赵宏玉.面部表情特征抽取的研究进展[J].计算机工程与应用,2006(9).

[11]刘艳丽,赵跃龙.人脸识别技术研究进展[J].计算机工程,2005(3).

[12]刘露.识别人脸的技术[J].百科知识,2007(2).

人脸识别的核心技术篇7

智能客服:语音识别与自然语言处理应用

语音识别与自然语言处理等人工智能技术可以为金融机构提供在线智能客服的功能,这种功能一方面代替了人工客服,另外,在很多模式下,如电话、网页在线、微信、短信及APP中都可使用,所以推广得非常快。

金融机构通过具备人工智能的智能客服,不仅可以与客户进行语音或文本的互动交流,理解客户业务需求,语音回复客户提出的业务咨询,还能够根据客户语音导航至指定业务模块。另外,金融机构还可以对传统按键式菜单进行改造,让用户使用自然语音与系统交互功能实现菜单扁平化,提升用户满意度,减轻人工服务压力,降低运营成本。

比如交通银行推出智能网点机器人“交交”,由于电话客服不再受限于菜单,可开展全业务的语音导航服务,所以引发了银行界的广泛关注。“交交”为实体机器人,采用语音识别和人脸识别技术,人机可以进行语音交流,还可以识别熟悉客户,在网点进行客户指引、介绍银行的各类业务等。在语言交流过程中,“交交”能回答客户的各种问题,缓解等待办理业务的银行客户潜在情绪,分担大堂经理的工作,分流客户,节省客户办理时间。

平安集团则整合旗下保险、基金、银行、证券等客服渠道为95511热线,应用人工智能技术,用户拨打热线后直接说出服务需求,系统识别客户语音内容后,即可转接相应模块,大幅节省了客户选择菜单的时间。智能客服还可以进行简单问题回复,复杂问题则转人工进行支持,人机结合有效地解决了客户问题。

此外,在语音数据挖掘方面,金融公司通过人工智能技术,软件可自动将海量通话和各种用户单据内容结构化,打上各类标签,挖掘分析有价值信息,为服务与营销等提供数据与决策支持。语音语义分析还可以自动给出重点信息聚类,联想数据集合关联性,检索关键词,并汇总热词,发现最新的市场机遇和客户关注热点。同时,根据金融行业客服与客户的通话情况,可进行业务咨询热点问题梳理统计,由机器进行自动学习,梳理生成知识问答库,并作为后续机器自动回复客户问题的参考依据。

近几年来,包括工、农、建、中在内的多家银行已经通过各种措施进行网点智能化改造升级,打造注重客户体验创新型服务。让银行普通的金融终端产品有了视频互动、语音识别等智能应用。通过语音识别与自然语言处理技术形成的智慧服务模式,紧密地围绕着客户的需求,整合数据、流程以及相关系统,加快了金融与科技的快速融合,也为金融机构开展新的服务提供了新机遇。计算机可以实时语义理解,掌握客户需求,自动推送客户特征、知识库等内容,打造了完美的个人金融助理形象。

服务机器人技术:机房巡检与智慧服务

在金融机构的机房以及运营机构的大厅等核心区域,通过投放服务机器人,不仅可以及时发现处理潜在风险,替代或辅助人工进行监控,还能提升设备运营效率,并提升银行业务离柜转化率。

金融机构的机房巡检是必不可少的,但是在夏天40多摄氏度的高温现场,值班人员经常因此中暑。另外,如果人力检测,值班人员得拿手持设备对接头逐一检查,但这种测量有可能因距x不同造成结果不同。智能巡检机器人就可以发挥出无与伦比的优势。它的两只“眼睛”结合了普通的光相机和红外热成像相机。其中可见光相机可以实现远程实时监控及图像采集;红外热成像相机可实现设备红外热分析及热图采集,采集的图像数据通过云台实时传输到后台电脑,后台电脑通过人工智能计算分析出相关设备是否运转正常。

在我国银行服务过程中,柜台服务排队时间长、人工服务态度与水平参差不齐等问题长时间无法解决。由于很多银行顾客并不熟悉业务流程、也不清楚哪个自助设备能办理哪类业务,面对各种各样的自助设备有时几乎无从下手,因而不少顾客宁可在营业厅排队等上一两个小时等待柜台服务。

为了给顾客提供快速便捷的服务,提升银行营业厅的业务离柜率,很多银行开始运用机器人技术,在网点或机房投放智慧机器人,实现指定区域自动巡航功能,对客户进行迎宾分流,进行语音互动交流,根据客户知识库内容进行标准业务咨询和问答,减少大堂经理的重复性工作。同时通过前端采集客户数据,可开展精准营销工作。

如中国邮储银行最近开始在很多网店使用银行机器人“储储”,该机器人具有拟人化的的形象和相应感情和动作,其搭载了智能语音技术,有着拟人化外型,可自由移动,极富亲和力。有些顾客为了体验其功能,还成为了银行机器人的“铁杆粉丝”,每月光临网点数次。而机器人也正是把握好了这些与顾客良性互动的时机,在解答顾客咨询、与顾客友好沟通的过程中充分了解顾客需求,再据此挖掘顾客的营销价值,适时向他们推介信用卡、理财产品等金融商品或服务,为银行拓展营销空间与场景,创造新的营销价值。

银行网店的服务机器人还能够让无纸化金融和无纸化应用成为可能。服务机器人一般带有“手写电子签名系统”,顾客通过服务机器人就可以办理一些初级业务。顾客只需在机器人“面部”选择好相应的服务,并在电子触摸屏签上自己的姓名即可。未来,银行可以在机器人基础上上建立电子凭证管理系统,提供电子凭证取代纸质凭证的合规性和安全性解决方案,利用人工智能的技术进一步推动无纸化应用。

另外,以智能服务机器人为基础的智慧银行也开始在中国的一线城市建立起来。比如坐落于北京市海淀区西四环的一家智慧银行,行内分为业务办理区、自助服务区、客户体验区,设置了智能服务机器人、自助填单机、智能叫号预处理机、智能导览台、互动营销桌、微信照片打印机等各类智能设备。其中,智能服务机器人能帮助大堂经理识别引导客户,具备解答客户业务问题、引导、人脸识别功能。可根据客户语音语义,在知识库中检索相关信息,进行语音应答,带领有业务需要的客户前往相关区域通过智能终端进行业务办理。智能服务机器人在采集客户数据,开展大数据营销工作,完成查询、开卡、销卡等业务的辅助办理上已经越来越频繁。

计算机视觉与生物特征识别:人像监控与交易安全

计算机视觉与生物特征识别在金融行业中的应用越来越多。计算机视觉的直接应用是人脸识别,随着人脸识别技术的成熟,越来越多的金融商业化应用也浮出水面。尤其是银行领域,包括民生银行、农业银行、中国银行、交通银行在内的各大银行都纷纷布局人脸识别技术。

“人脸识别”自助终端是当前银行应用最为普遍的方向,比如交通银行的自助发卡机、民生银行的VTM、农业银行的超级柜台等都是将人脸识别系统引入到自助设备中,利用人脸识别技术将现场采集的照片与已存照片、身份证照片进行比对并提供人脸相似值,工作人员即可根据相似值的高低判断是否直接通过或进行人工审核。目前,用户可以在自助终端上实现自助开卡、业务变更、密码重置等个人业务,全流程电子化不仅节约时间和成本,也更加环保。不仅如此,银行工作人员也可以通过人脸识别自助终端实现一对多服务,通过客户自助办理+现场审核授权,原本只能服务一个客户的工作人员可以同时服务6-8人。

人脸识别技术在互联网金融P2P平台以及相关的APP中应用越来越广泛。比如在腾讯与公安部所属的全国公民身份证号码查询服务中心达成人像比对服务的战略合作后,微众银行的APP在工作中就可以利用人脸识别技术接入公安部查询服务中心的数据库进行对比。在微众银行开户过程中,当用户绑定两张银行卡以上时,手机应用会提醒为保证账户安全,出现通过人脸识别验证环节。而验证时,用户需要在光线合适的环境下,将脸部对准镜头后,同时跟读数字才可能通过验证。

利用人脸识别功能还能提前监控可疑人员、提示可疑行为动作,识别VIP客户。比如利用人脸识别系统,可以识别网点区域内可疑人员特征,如:是否人脸上有面罩、手持可疑物品、行动速度异常、人员倒地、人员胁迫等,还可以对客户身份进行识别。

人脸识别功能,还能起到监督和跟踪员工行为的作用,并判断员工行为是否合规及是否安全等。通过识别并标记视频监控中发现的员工可疑行为录像片段,提示后台人员进行查看,可以对一线操作人员起到心理震慑作用。通过纸文本读取技术,排查所有交易单据,建立关键字提示技术。人脸识别与语音识别相互结合,通过回访客服问答、柜台对话记录,建立风险模型,可以及时发现可疑交易。

生物特征识别则主要是通过高科技手段利用人体固有的生理特性,如指纹、人脸、虹膜等以及行为特征包括笔迹、声音、步态等进行身份鉴定。这些生物特征信息的收集主要是为了身份识别,提高风险控制水平。例如传统的办贷款流程:用户提交申请贷款机构审批贷款机构放款用户还款(机构贷后管理),用户需要在贷款机构的网点现场填写申请贷款信息,提交相关材料;贷款机构一般有信审专员人工审核贷款请求。在引入人工智能后,在申请贷款阶段用户可以利用互联网通过活体检测、人脸识别、声纹识别、OCR(光学字符识别)、指纹识别等技术录入、验证与个人相关的材料,以保证是用户本人的申请(避免欺诈行为)。对于贷款机构而言,可以利用互联网实现用户的线上申请,快速提高申请效率,拓展用户群。在信用审核阶段,机构可引入人工智能的大数据风控算法来进行自动化审批。

在生物识别技术中,人脸识别的精准度并非最高,例如指纹和虹膜就可以达到更高的精准度。在一些非常机密的区域,比如集中运营中心、数据中心机房、保险柜、金库等重要场所,金融机构可采用人脸门禁配合指纹和虹膜识别等人工智能技术,对进入人员进行验证,实现银行内部安全管理,有效地防范不法分子的非法入侵,达到安全防范的目标。

大数据:投资决策与融资授信决策

在投资决策方面,基于大数据技术的人工智能技术正在催生行业的变革,并给投资顾问领域带来了全新的视角,从而也催生了一个新的名词――智能投资顾问。花旗银行在2016年的研究报告指出,从2012年到2015年底,依赖人工智能技术的智能投资顾问管理的资产规模从0上升至290亿美元,而且其管理的财产规模还将在未来十年中呈现出几何级数的增长,预计总规模将会高达5万亿美元。目前,在发达国家中,以人工智能为基础的投资公司越来越受青睐,一些可提供资产管理服务的互联网公司已颇具规模,Wealthfront、Betterment、PersonalCapital、FutureAdvisor都是其中的佼佼者。

@些依赖人工智能技术的投资公司提供的主要是在线财富管理服务。其服务特点主要体现在可以根据现代资产组合理论,结合个人投资者的具体风险偏好与理财目标,通过后台算法与用户友好型界面相结合,利用交易所上市股票基金组建投资证券组合,并持续跟踪市场变化,在这些资产偏离目标配置的时候进行再平衡。

比如美国的Betterment设立了两个投资项,其中一个是股票组合,另一个是超安全债券组合。用户的个人银行账户与Betterment网站捆绑之后,用户可通过调整指针来调整两个投资项间的资金分配比例,调整风险的高低。

美国的另外一家公司Wealthfront则以调查问卷的形式了解用户的风险偏好,然后根据评估结果为用户量身定制投资计划。如果用户接受该计划,平台则随时监控该投资组合的动态,并定期对计划进行更新,以便合理控制风险,使之始终落在用户的容忍范围之内。目前Betterment的投资组合基于13种指数基金(ETF),其中包含了6种股票基金和7种债券基金。相比Betterment,Wealthfront的投资组合类型更加全面,包括了硬资产项目――房地产和自然资源。目前WealthFront和Betterment各自掌控着超过30亿美元的资产,是行业中规模最大的两家公司。

除了这些公司,智能投资顾问的重要性也被越来越多的传统金融机构所意识到。不久前,全球最大的基金管理公司贝莱德协议收购了FutureAdvisor,根据收购协议,这家智能投顾公司的估值达到了2亿美元。此外,美国最大的证券零售商和投资银行之一的美林证券准备引入机器人做财务顾问。据了解,该银行已经投入了部分员工使用自动化模型工具进行投资顾问服务,主要是针对25万美元以下的投资项目。

由于智能投资顾问具有速度快、精度高以及执行交易敏捷的优势,且一个智能交易程序具有同时跟踪上百只证券的能力,能实时盯盘,根据盘中申报单以及高频交易数据的状况,即时拟订最优的交易指令,并精确执行,所以各种跨金融市场、跨交易品种的交易均可以轻松地实现。如纽约公司RebellionRe-search推出首只人工智能投资基金。该公司的交易系统主要基于贝叶斯机器学习,并结合预测算法,通过响应新的外部信息和过去经验而不断自我演化,有效完成了自学习,在全球44个国家成功进行股票、债券、大宗商品和外汇等方面的交易。

人脸识别的核心技术篇8

关键词:人脸识别;刷脸登录;客户管控

1绪论

近年来,国家电网供电营业厅不断推进“三型一化”的改革,大量营业厅进行了重新规划部署,尤其在智能化服务上,引入了大量自助设备,减少人工柜台,提升了客户的智能化体验,但是同时带了一些问题,用户每次使用自助设备时,均需输入用户号及密码,或者刷身份证才能登入系统办理相关业务,而相关账号和密码往往容易忘记,身份证也容易忘记携带,导致客户无法办理业务,这给用户带来了不便,也是智能化服务的缺陷。人脸识别技术,作为生物特征识别领域中一种基于生理特征的识别技术,是通过有摄像头的终端设备拍摄人的行为图像,通过人脸检测算法,从原始的行为图像中得到人脸区域,用特征提取算法提取人脸的特征,并根据这些特征确认身份的一种技术,与其它生物特征识别技术相比,人脸识别在实用性方面具有独到的技术优势,主要体现在以下方面:(1)不需要检测人员配合,具有操作隐蔽性强,因为不容易引起人的注意而不容易被欺骗。利用采集指纹、虹膜等,这些特殊的采集方式很容易被人察觉,从而更有可能被伪装欺骗。(2)采用非接触式采集,没有侵犯性,不会令人反感,容易被接受。而指纹、虹膜采集往往给人造成不适的感觉。(3)并发性,即实际应用场景下可以进行多个人脸的抓拍、判断及识别。(4)事后追踪能力强,简单易用,普通操作人员即可进行判断核实。而普通人一般不具备对于指纹、虹膜的判断能力。(5)实现设备通用、简单,尤其是采集设备成本较低。而虹膜采集仪、DNA鉴别仪等都需要专用的采集设备,而且设备昂贵。目前人脸识别技术已广泛在银行、超市、火车站和机场等重要领域应用,技术已相当成熟,甚至支付宝已推出刷脸支付功能,因此本文研究将人脸识别技术应用到供电营业厅中,一方面,与传统账户密码登录和刷身份证登录方式配合使用,方便客户,并提升客户满意度;另一方面通过人脸识别技术,可快速识别重要客户,并关联业务后台,及时通知客户经理,实现主动服务。

2人脸数据采集

要进行人脸识别之前,关键的是建立人脸库,营业厅可通过以下几种方式进行人脸采集,进来用户人脸库,为下一步人脸识别提供数据支持。(1)自助设备人脸采集,由于营业厅已部署大量自助设备,如取号机、缴费机及业务机,在用户取号或输入账户时,正对着设备时进行拍照及关联,如下图所示。人脸采集方式图(2)人工柜台人脸采集,对于没有使用自助设备,而选择人工柜台办理业务的用户,可采用高拍仪进行人脸采集,目前,不少高拍仪整合了二代证识别模块,兼具拍照和身份证识别功能,只要高拍仪厂家提供相关数据读取接口,我们获取身份证信息与人脸关联好的数据并接入人脸识别系统分析。系统可以实时反馈认证合一的比对结果,同时将信息存入后台系统建库。高拍仪适合部署在柜台窗口的桌面上朝向来访人员。(3)APP平台人脸采集,对于不经常来营业厅办理业务,选择使用APP线上业务办理的用户,可以在用户登入APP时,增加人脸采集功能,方便下次刷脸登入。

3人脸识别

可在自助设备上安装微型深眸人脸摄像机,并在营业厅的监控中心配置大超脑NVR,在自助机上增加刷脸登录方式,进行拍照后,进行人脸识别,与后台人脸库进行匹配,匹配成功后,则意味着登录成功,关联用户电力账户,用户可进行相关业务办理,大大提升用户体验。同时可在营业厅大门、营销体验区和自助服务区,处安装深眸人脸摄像机,对用户进行抓拍,智能识别出客户信息,推送相关客户进行主动精准服务,如VIP客户,可在后台自动提醒对应客户经理提前进行资料准备,提供专业服务,提升了客户的满意度及认可度。同时可用利用人脸识别对用户在营业厅的行为轨迹进行分析,对异常行为人群及时提供帮助,利用人脸识别也方便进行录像定位,比如要查找某个人在营业厅的过去轨迹,用该人脸与录像进行匹配,可直接调出含有该人的录像。

人脸识别的核心技术篇9

关键词:身份鉴别;人体生物特征;发展趋势

1. 引言

信息化高速发展的一大特征是个人身份的数字化和隐性化,如何准确鉴定一个人的身份,保护信息安全是当今信息化时代必须解决得一个关键性社会问题。生物特征身份鉴别技术是身份鉴别领域的一个研究热点。生物特征识别技术是指利用人体固有的生理特征或行为特征来进行个人身份鉴别认证的技术。生物特征识别技术包括采用人体固有的生理特征(如人脸、指纹、虹膜、静脉、视网膜)进行的身份认证技术和利用后天形成的行为特征(如签名、笔迹、声音、步态)进行的身份认证技术。与传统的身份鉴定手段相比,基于生物特征识别的身份鉴定技术具有如下优点:(1)不会遗忘或丢失;(2)防伪性能好,不易伪造或被盗;(3)“随身携带”,随时随地可用。正是由于生物特征身份识别认证具有上述优点,基于生物特征的身份识别认证技术受到了各国的极大重视。

2.  生物特征识别技术的现状及发展趋势

目前,常用的生物特征识别技术所用的生物特征有基于生理特征的如视网膜、人脸、指纹、虹膜,也有基于行为特征的如笔迹、声音等。下面就这些常见的生物特征识别技术的特点及其发展趋势进行讨论研究。

2.1.视网膜识别

人体的血管纹路也是具有独特性的,人的视网膜表面血管得图样可以利用光学方法透过人眼晶体来测定。用于生物识别的血管分布在神经视网膜周围,即视网膜四层细胞得最远处。如果视网膜不被损伤,从三岁起就会终身不变,如同虹膜识别技术一样,视网膜扫描可能具有最可靠,最值得信赖得生物识别技术,但它运用起来的难度较大。视网膜识别技术要求激光照射眼球的背面以获得视网膜特征得唯一性。

视网膜技术的优点:视网膜是一种及其固定得生物特征,因为它是隐藏的,故而不易磨损,老化;非接触性得;视网膜是不可见得,不会被伪造。缺点是:视网膜技术未经过任何测试,可能会给使用者带来健康的损坏。

2.2.人脸识别

人脸识别作为一种基于生理特征的身份认证技术,与目前广泛应用的以密码、IC卡为媒

介的传统身份认证技术相比,具有不易伪造、不易窃取、不会遗忘的特点;而人脸识别与指纹、虹膜、掌纹识别等生理特征识别技术相比,具有非侵犯性、采集方便等特点。因而人脸识别是一种非常自然、友好的生物特征识别认证技术。

人脸识别技术包括图像或视频中进行人脸检测、从检测出的人脸中定位眼睛位置、然后提取人脸特征、最后进行人脸比对等一系列相关的技术。

为了评测基于面部图像的人脸识别算法的性能。美国ARPA和ARL于1993年至1996年建立了FERET数据库,用于评测当时的人脸识别算法的性能。共举行了三次测试FERET94、FERET95、FERET96。FERET测试的结果指出,光照、姿态和年龄变化会严重影响人脸识别的性能。

FERET的测试结果也表明了基于面部图像的方法的缺点。人脸是一个三维非刚体,具有姿态、表情等变化,人脸图像采集过程中易受到光照、背景、采集设备的影响。这些影响会

降低人脸识别的性能。

为了克服姿态变化对人脸识别性能的影响,也为了进一步提高人脸识别性能,20世纪90年代后期,一些研究者开始采用基于3D的人脸识别算法。这些算法有的本身就采用三维描述人脸,有的则用二维图像建立三维模型,并利用三维模型生成各种光照、姿态下的合成图像,利用这些合成图像进行人脸识别。2000年后,人脸识别算法逐渐成熟,出现了商用的人脸识别系统。为了评测这些商用系统的性能,也作为FERET测试的延续,美国有关机构组织了FRVT2000、FRVT2002、FRVT2006测试。测试结果表明,人脸识别错误率在FRVT2006上下降了至少一个数量级,这种性能的提升在基于图像的人脸识别算法和基于三维的人脸识别算法上都得到体现。此外,在可控环境下,虹膜、静态人脸和三维人脸识别技术的性能是相当的。此外,FRVT2006还展现了不同光照条件下人脸识别性能的显著提高,最后,FRVT2006表明人脸自动识别的性能优于人。值得一提的是,清华大学电子工程系作为国内唯一参加FRVT2006的评测的学术机构,其人脸自动识别性能优于人类。FRVT2006为人脸识别后续的研究指明了方向,人脸识别中光照、年龄变化依然对人脸识别性能有很大影响,二维人脸识别的性能不比三维人脸识别差。

人脸识别得优点:非接触性的。缺点是:要是比较高级得摄像头才也有效地扑捉面部图像;使用者面部的位置与周围得光环境都可能影响系统的精确性,而且面部识别容易受欺骗;

对于采集图像的设备会比其他技术昂贵得多。

2.2. 指纹识别

指纹识别技术是指通过比较不同人指纹中的特征点不同来区分不同人的身份。指纹识别技术通常由三个部分组成:对指纹图像进行预处理;提取特征值,并形成特征值模板;指纹特征值比对。指纹图像预处理的目的是为了减少噪声干扰的影响,以便有效提取指纹特征值。常用的预处理方法有图像增强、图像平滑、二值化、图像细化等。

特征提取的目的就是从预处理后的指纹图像中,提取出能够表达该指纹图像与众不同的特征点的过程。最初特征提取是基于图像的,从图像整体中提取出特征进行比较,但该方法的精度和性能较低。现在一般采用基于特征点的方法,从图像中提取反应指纹特性的全局特征(如纹形、模式区、核心区、三角点、纹数等)和局部特征(如终结点、分叉点、分歧点、孤立点、环点等)。得到特征点后就可以对特征点进行编码形成特征值模板。指纹特征值比对就是把当前获得的指纹特征值与存储的指纹特征值模板进行匹配,并给出相似度的过程。

    指纹识别的优点:技术相对成熟;成本较低。缺点是:具有侵犯性;指纹易磨损,手指太干或太湿不易提取图像。

2.3. 虹膜识别

虹膜相对而言是一个较新的生物特征。1983年,Flom与Safir申请了虹膜识别专利保护,使得虹膜识别方面的研究很少。1993年,Daugman发表了关于虹膜自动识别算法的开创性工作,奠定了世界上首个商业虹膜自动识别系统的基础。随着Flom和Safir专利在2005年的失效和CASIA及ICE2005中虹膜数据集的提供,虹膜识别算法的研究越来越蓬勃。I CE2006首次对虹膜识别算法性能进行了测试。虹膜识别中需要解决如下两个难点问题:一是虹膜图像的获取,二是实现高性能的虹膜识别算法。

3.  结论

本文讨论了一些常用的生物特征识别技术的技术特点及发展趋势。随着各国对生物特征识别技术的越来越重视,生物特征识别技术必将获得更快的发展。

参考文献:

[1]张敏贵,潘泉,等.多生物特征识别[J].信息与控制,2002,31(6).

[2]杨俊,景疆.浅谈生物认证技术——指纹识别[J].计算机时代,2004,(3).

[3]侯鸿川.面部温谱图身份识别技术探讨[J].中国人民公安大学学报(自然科学版),2005,(3).

人脸识别的核心技术篇10

百度:AI成为头号战略 无人驾驶是重中之重

三家企业中,对人工智能布局最早、投入成本最高的当数百度。百度创始人李彦宏日前在接受《财经》杂志采访时曾说:“人工智能确实会带来无穷无尽的可能性,在这方面百度目前确实也是非常领先的。如果这个机会我们能够抓住,百度可以变成一个完全不一样的公司,变成一个比现在影响力大得多的公司。”

早在2013年,百度就成立了深度学习研究院,致力于人工智能的开发,是当时国内唯一一家在深度学习方面进行大规模投入的公司。目前,百度研究院、百度大数据、百度语音和百度图像等技术都已归入人工智能技术体系。百度在人工智能领域涉猎项目众多,主攻方向有六个:深度学习平台、图像识别基本技术、细粒度图像识别、视频分析、AR技术和医院图像识别。

经过几年的发展,百度在人工智能领域共获得了超过1500项发明专利,领先于微软、IBM等老牌科技巨头。此外,百度大脑、人脸识别技术精度、语音识别能力均已达到世界顶级水平。2014年,百度在硅谷投入3亿美元打造了人工智能中心,并在硅谷大举招揽人才,中心目前已经有近200名员工。据悉,百度硅谷研发中心的一个重要使命是服务于百度无人驾驶业务。

自无人驾驶的概念在业界兴起,就有两拨力量在这一领域博弈,一为传统车企,一为高科技企业。根据自身不同的基因,它们对无人驾驶的理解和布局完全不同。传统车企的思路为无人驾驶是“装了电脑系统的汽车”,它们通常从低级的辅助驾驶开始做,希望通过不断地提升辅助驾驶的能力来达到未来完全的无人驾驶;而高科技企业对无人驾驶的理解是“装了四个轮子的电脑”,它们通常直接进行无人驾驶研发,最典型的代表是百度和谷歌。

今年8月,在深圳举办的的CCF-GAIR大会上,百度无人驾驶事业部总经理王劲说道,“百度的人工智能主要靠三个最核心的东西:一个是算法,一个是海量数据,第三个是优秀的计算能力。”

百度的无人驾驶事业部成立于2015年底,是百度目前最被寄予厚望的业务。百度今年在芜湖打造了“全无人车运营区域”,又投资了硅谷知名激光雷达公司Velodyne LiDAR,旨在降低无人车生产成本,加速无人驾驶的商业化进程。

经历了这么多前期投入,百度无人车何时能实现规模量产?王劲告诉记者:“五年后百度无人车将进行量产,届时成本会大大低于雇用驾驶员,大幅度提升交通安全及交通效率,且让人们的出行成本更低。”

腾讯:AI技术研发围绕核心业务展开

社交作为腾讯的核心业务之一,其平台和大数据等优势为人工智能技术的研发提供了更多支持,也为技术在业务上的落地应用提供了更多可能。据了解,腾讯的人工智能研发团队镶嵌在不同的事业群里,微信团队的人工智能小组主要致力于语音识别的研发,SNG(社交网络事业群)主攻人脸识别、图片识别等,搜索部门则关注自然语言识别。各部门根据自身业务需要,进行人工智能技术的开发。

在前不久举办的GAIR大会上,腾讯优图实验室总监黄飞跃接受采访,讲解了优图团队目前的主要工作。黄飞跃带领的优图团队隶属于社交网络事业群,QQ系列产品的很多功能背后都有优图团队的技术支持。优图团队的技术主要分为人脸识别、图片识别、音频识别三个部分,目前为QQ空间、QQ音乐等超过50款产品提供技术支持。具体而言,人脸识别主要用于腾讯旗下微众银行进行人证合一比对、QQ空间好友照片标记;图片识别则在微云相册、手机相册管家等图片标记管理功能中有所体现;音频识别主要应用于QQ音乐听,识曲、全民K歌等功能。这些功能主要用于提升腾讯一系列产品的用户体验,提高用户留存率。

去年6月,优图团队在国际权威人脸识别数据库LFW上以99.65%的成绩刷新世界纪录,超过了实力强劲的Linkface、Face++等新秀,以及Facebook、Google等国际巨头。目前,优图的图片识别技术已经开放给业界,通过“优图开放平台”和“腾讯云-万象优图”两个产品,开发者可以拥有顶尖团队的图片处理能力。

阿里巴巴:从小AI到ET 阿里云厚积薄发

阿里布局人工智能主要集中于三方面:云计算、物联网、VR/AR。他们的战略是从业务驱动开始,逐渐加大档位。阿里选择医疗这一领域切入人工智能技术。阿里在全国各地广泛布局医疗团队,据统计,参与阿里“未来医院”计划的医疗机构已经覆盖了全国90%的省份。未来,病患只需在家附近的医院拍一张CT,就可以通过远程技术完成专家级的诊疗过程。而这种诊疗正是基于阿里云人工智能医疗系统。

2016年,随着人工智能概念不断升温,阿里加速了布局的脚步。2016年8月举办的云栖大会上,阿里云进行了品牌升级。除了换掉已使用6年的“云”字logo(商标)外,还了一款名为“ET”的人工智能机器人。

ET是四个月前的小AI的升级版,它的功能不再局限于说话聊天,而已被赋予了全局意识。基于阿里云强大的计算能力,ET目前已具备智能语音交互、图像/视频识别、交通预测、情感分析等技能。

阿里云认为,在AI大时代,大数据量背后的数学分析建模以及神经网络深度学习是发展重点。通过计算,数据之间产生了关联,从而对人类产生现实意义。ET可以在对大数据进行分析整理后,对大环境产生整体判断和把控,从而解决一些现实生活层面的应用问题。