机器学习技术应用经验及建议

时间:2022-02-28 11:33:27

机器学习技术应用经验及建议

摘要:机器学习技术是人工智能的核心,是计算机智能化的基础。机器学习技术逐步成为计算机科学、人工智能等信息产业的主要发展方向。文章结合机器学习技术的发展对目前机器学习技术的应用现状进行了简要分析,并提出了几点建议。

关键词:机器学习技术;应用经验;建议

机器学习技术是人工智能的核心,是计算机智能化的基础。21世纪以来,机器学习技术逐步成为计算机科学、人工智能等信息产业的主要发展方向。其实早在计算机科学创立的同时,计算机科学的鼻祖图灵就为人类打开了人工智能的大门,他曾说过“Acomputerwoulddeservetobecalledintelligent,ifitcoulddeceiveahumanintobeliev-ingthatitwashuman.”意思就是“当一个计算机能成功欺骗人类,让他们觉得它是一个人的时候,这样就能被称为人工智能。”以此来看,想要真正地实现计算机的人工智能,必须依靠机器学习技术,只有机器具备了和人类一样的学习能力,才能被称为是人工智能。机器学习是一门综合性、多领域交叉渗透的学科,主要涉及统计学、凸分析、逼近论、概率论、算法复杂度理论等学科。机器学习技术的主要研究目的是通过研究计算机如何学习和模拟人类的学习行为,让计算机获取新的技能或知识,并通过对所学知识的整合改善自身性能。

1机器学习技术的发展历程

机器学习技术的发展历程根据研究途径及研究目的大致可分为四个阶段。第一阶段为二十世纪五十年代中叶至六十年代中叶,这段时期机器学习技术主要研究机器“有无知识的学习”。具体方法是通过对机器的相关性能参数和所处环境的变化来检测机器系统所反馈出的相应数据,即给系统一个运行程序,然后改变其自由空间作用,而系统将受程序的影响而改变自身的组织结构,最终系统会选择最优环境生存。该阶段内最具代表性的机器学习研究就是Samuet的下棋程序,该阶段机器学习技术还处于启蒙阶段,研究方式和结果相对简单,无法满足人们的生产生活需要[1]。第二阶段为二十世纪六十年代中叶至七十年代中叶,该阶段机器学习技术主要研究将不同领域的知识信息植入到系统中,通过图结构及逻辑结构方面的系统描述语言将相关知识转化为机器语言,以此来达到让机器模拟人类学习的目的。但在进行相关研究过程中,人们发现人类的学习过程是一个长期、复杂的过程,而在该阶段的机器学习无法让系统进行更深入的学习。在此阶段机器学习方面最有代表性的成果就是Winson和Hayes-Roth的对结构学习系统方法。第三阶段为二十世纪七十年代中叶至八十年代中叶,该阶段又被称为机器学习技术的复兴时期。通过前两个发展阶段的积累,人们在此阶段将系统学习单个概念扩展至学习多个概念,并探索出各种不同的机器学习方法和策略,最重要的是,在该阶段内人们开始将机器学习技术与其他体系的应用进行结合。相关的应用和专家系统对知识获取的需求也相应地激励了机器学习技术的发展,机器学习技术的发展主流也从专家学习系统转变为实例归纳学习系统,这就表示机器学习技术的研究目的已经发展为如何让机器系统自主获取知识。在此期间,第一届机器学习国际研讨会在美国卡内基梅隆召开,标志着机器学习技术的发展受到了人们的广泛关注[2]。第四阶段即从二十世纪八十年代中叶至今,该阶段是机器学习技术发展的最新阶段,伴随机器学习技术不断发展,其逐渐具备了下列特点:(1)机器学习技术发展成为新的系统学科,其综合应用了生物学、数学、心理学、神经生理学、计算机技术、自动化技术等学科的相关知识。(2)机器学习技术融合和发展了不同的学习方法,形式更加灵活、更加高效的集成式学习系统研究也正在慢慢兴起。(3)关于机器学习技术与人工智能技术在一些基础问题上形成了统一性的观点。(4)随着机器学习技术中各种类型的学习方式的应用,其应用范围不断扩展,相关的研究成果逐步在向产品转化。(5)机器学习技术及相关技术的研究空前活跃。

2机器学习技术的应用及建议

随着计算机技术的不断发展,大数据及云计算等技术日益成熟,这给机器学习技术的发展带来了广阔的空间和完备的技术条件。2016年3月,阿尔法狗(AlphaGo)与围棋世界冠军李世石进行了一场人机大战,最终总比分4:1。之后,阿尔法狗在网上以“Master”为名与中日韩数十位高手进行了切磋,60局无一败绩,并在2017年5月举行的中国乌镇围棋峰会上战胜世界排名第一的围棋冠军柯洁。国家语委和教育部于2017年7月18日在北京了2016年《中国语言生活状况报告》,“阿尔法狗”一词成为2016年中国媒体年度新词[3]。“阿尔法狗”的核心原理就是深度学习,它的围棋水平证明了机器学习技术的发展已经有了一定成果。目前,机器学习技术的应用范围越来越广泛,主要应用范围如下:2.1数据挖掘与分析。“数据挖掘”与“数据分析”在机器学习领域是相似的意思,主要是指从大量数据中识别出有效的、特殊的、有价值的数据信息。在信息技术应用之前,人们只能通过人工对数据进行挖掘和分析,而随着信息时代来临,数据信息呈爆炸式发展,人们在无时无刻的创造数据,也在不断地使用数据来进行工作和生活[4]。数据挖掘与分析是机器学习技术中数据存储技术与算法的结合,通过目前高效的数据存储技术进行数据的高效读写,再通过机器学习技术提供的知识发现、数据统计分析等方式分析海量数据中的有用信息。由此可见,机器学习技术在数据挖掘和分析方面具有无可比拟的优势。2.2模式识别。模式识别最早属于工程学科的范畴,而机器学习技术属于计算机科学,两者的结合给模式识别领域带来新的发展机遇。其主要研究方面有两部分:(1)研究生命体如何感知外界环境和其他生物,也就是认识科学的研究范畴。(2)在特定的环境或需求下,通过计算机技术实现模式识别,这就是机器学习技术的研究内容,也是机器学习的长项。在信息时代,模式识别的应用越来越广泛,通过图像分析、计算机视觉、光学文字识别、语音识别、手写识别、自然语言处理、生物特征识别等方式的应用,能让人们在工作和生活中更加便捷、更加智能化。例如基于生物特征识别和语音识别等技术,我们现在可以通过人脸开手机或开锁、可以刷脸支付、可以语音控制智能家居,而这些模式识别正式机器学习技术所擅长的。2.3在生物信息学上的应用。随着基因技术的发展,人们对基因组及相关测序项目的研究不断深入,并积累了大量的数据信息,生物信息学的研究重点会逐步从提取数据转变为分析数据。如此庞大和复杂的数据对计算机软件和理论算法提出了极高的要求,而机器学习技术目前日趋成熟,遗传算法、神经网络、支持向量机和决策树等相关方法正适合处理生物信息学中海量、缺乏统一理论标准且还有噪声的数据[5]。2.4具体应用(1)虚拟助手。目前,虚拟助手的应用越来越广泛,例如百度旗下的“小度”和小米旗下的“小艾同学”等都属于近年来比较火热的虚拟助手产品,它们能通过语音或生物识别技术识别你的具体指令,然后通过机器学习技术帮你控制家用电器或帮你规划最优交通路线等等。(2)无人驾驶。无人驾驶至今已经发展了近五十年,目前世界上最先进的无人驾驶汽车已经测试行驶近五十万公里,且其后八万公里的行驶过程中完全没有人为干预。无人驾驶技术即通过机器学习技术感知周边环境并自行对环境信息进行处理,然后再进行驾驶操作[6]。

综上所述,随着信息革命的深入和大数据时代的来临,人们只有通过机器学习技术对数据、知识进行高效获取和处理,才能有效提高生产效率和生活质量。特别是针对工程应用和科学研究领域的复杂问题的解决,机器学习技术具有明显的优势。因此,未来科技的发展、社会的进步离不开机器学习技术的合理应用。

参考文献:

[1]黄鲁成,薛爽.机器学习技术发展现状与国际竞争分析[J].现代情报,2019,39(10):165-176.

[2]张军英.机器真智能与现行机器学习技术[J].新教育时代电子杂志(教师版),2019(1):91,88.

[3]马振.AlphaGo背后的机器学习技术[J].电脑迷,2018(16):81.

[4]刘伟佳,李博权.物联网、大数据分析和机器学习技术在灾备中的应用研究[J].微电子学与计算机,2018,35(12):55-58.

[5]薛明峰.机器学习安全性问题及其防御技术研究[J].中国战略新兴产业,2018(26):213.

[6]林泓宇.大数据背景下的机器学习及其关键技术[J].电脑迷,2018(6):122.

作者:吴建华 单位:河北工程大学