计算机语言学关键问题研究

时间:2022-01-28 08:21:42

计算机语言学关键问题研究

摘要:近几年,随着产业界人工智能领域应用服务不断落地,学术界对于AI分支科学的研究也愈加深入。NLP,即自然语言处理,在信息时代向智能时代的过渡中发挥着极其重要的作用。由此衍生出的一门高度交叉的新兴学科,计算机语言学,也正在进行着突飞猛进的发展。自然语言处理是计算机翻译的过程,涉及数据挖掘、知识图谱、机器学习及与语言计算相关的语言学等研究。中文自然语言处理是以转换自然语言为基本原则,遵循基于规则、基于统计等研究思路,并且适当添加一些可靠的实例来完成翻译过程。本文我们将围绕计算机在处理中文自然语言方面的问题来展开分析,通过详细的分析了解一下中文自然语言处理的基本概念,再来研究一下中文自然语言处理的关键问题与步骤。

关键词:自然语言处理;自动分词;机器学习;语言学

一、针对于中文自然语言处理含义的分析

语言是人传递信息的关键因素,其本身的复杂性与语言描述外部世界的复杂性,表明机器理解语言是一个艰难的过程。所以说要采取有效手段促使消除语言和交流障碍的信息化,从而通过算法和数据模型处理来达到自然语言处理的目的。所谓自然语言处理,包括词法分析、语法分析、语义分析、篇章理解,通过自然语言处理能够更好的研究和实现人和计算机之间用自然语言进行有效通信的手段。自然语言处理和语言学的分析研究有着深远的联系,但是也同样有着一定的区别。对自然语言处理的研究不是单一的研究自然语言,而是在研究自然语言的基础上来研究和实现自然语言通信的计算机系统。通过大规模的数据训练机器,使机器掌握自然语言间的规则,进行准确的处理与翻译。自然语言处理问题主要包括了对计算机和人类思维的学习,但是翻译工作是一项比较复杂的过程,同时也是一种从简单智能到相对信息化问题的过程,在处理中存在对各种特殊的常识处理存在匮乏的因素,也就导致出现一些语境分析不透彻的情况发生,进一步也将会影响相应的处理结构[1]。

二、针对于中文自然语言处理与计算机结合的分析

中文自然语言处理就是对汉语中的汉字等自然语言处理翻译的过程,当前我国相关研究人员对自然语言处理信息化的研究力度还不够深入。这是由于中文自然语言处理,相比于英语等有天然分隔符的语言,难度更大。例如,界定单词边界的词法分析任务,也被称为“中文自动分词”的任务,是中文语言处理的首要步骤。其中,新词发现、歧义切分等关键问题又是基于对语言的理解之上的。下面我们再来详细了解一下中文自然语言处理技术发展的基本现状,首先我们根据以GATE为基础的自然语言处理技术来展开分析。由于以GATE为基础的自然语言处理技术是语言工程学软件体系结构的基础,从而一些关于工程学的语言行为就都是能够专业化进行衡量的。在经过自然语言处理以及人工交互的处理以后,能够更加全面的构成相应的软件和应用,最终再通过计算机语言学中的各种工具和计算机科学专业的可预测性来完成进一步的设施组织[2]。

三、针对于中文自然语言处理关键问题的分析

中文自然语言处理主要体现在中文自然语言信息主题知识获取瓶颈处理上,因为中文自然语言处理的领域以及时间的处理、对机器翻译的知识性等都应当进一步结合这种模式的深度和难度,最后完成中文自然语言处理的传统信息知识处理。需要注意的是应当根据语义网来更加直观的分析系统规划的各个流程,然后依据适应性来适当增加对中文自然语言有关知识的系统支持和关注。相关人员对中文自然语言信息统计机器翻译模型顺利的开展和完成统计工作,能够有效的对中文自然语言处理的相关手段提供更多的关注,根据当前的翻译系统来选择一种比较相近的编码过程,进而专业的推出解码的主要法则。中文自然语言信息统计要合理的从处理技术的应用中体现出来,在信息理论模型当中完成噪声处理复杂问题。除此之外,在面对中文自然语言信息处理其他一些问题时,一般情况下都是通过采用中文自然语言信息聚类处理来完成的,在当前现有层次的算法的基础上合理的来对平面分割算法等手段进行利用,最后通过有效的结合算法性能共同完成分析过程[3]。

四、总结

通过上述问题的分析,我们已经意识到中文自然语言处理和计算机结合的重要性和必要性。随着人工智能相关技术的不断发展,中文自然语言处理和计算机的结合问题也将会面临大量的知识成本,这就要求从中文自然语言的处理、发展历程以及传统处理手段等来进一步对建模的核心问题完成相应的处理。针对于不同类型的限制条件和因素最大限度的达到最优的处理效果,并且管理人员和工作人员还可以通过相应的实验来进行中文自然语言信息的处理,最终实现更精准的效果和目的,更好的推动中文自然语言处理与计算机的结合。

参考文献

[1]自然语言处理与中文计算会议征文通知[J].计算机应用研究,2013(2):12-13.

[2]第五届国际自然语言处理与中文计算会议暨第24届国际东方语言计算机处理会议(NLPCC-ICCPOL2016)[J].计算机工程与设计,2016(11):111-113.

[3]刘源等着.信息处理用现代汉语分词规范及自动分词方法[M].桂林:广西科学技术出版社,1994.

作者:庞宇 单位:北方工业大学计算机学院