资源描述:
《第1章:引论. - 自然语言理解》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、自然语言理解自然语言理解宗成庆宗成庆中国科学院自动化研究所中国科学院自动化研究所模式识别国家重点实验室模式识别国家重点实验室No.95,ZhongguancunEastRoad,http://www.ia.ac.cnBeijing100080,ChinaTel.No.:+86-10-62554263联系方式联系方式ò联系电话联系电话:62554263ò电子邮件电子邮件:cqzong@nlpr.ia.ac.cnò个人主页个人主页:http://www.nlpr.ia.ac.cn/English/cip/cqzong.htmò
2、通信地址通信地址:100080中关村东路95号中科院自动化研究所模式识别国家重点实验室第第11章章绪绪论论NLPR,CAS-IA宗成庆:《自然语言理解》讲义1.11.1问题的提出问题的提出∑自然语言是指人类日常使用的语言,如汉语、英语、法语,德语,等等∑语言是思维的载体,是人类交流思想、表达情感最自然、最直接、最方便的工具∑人类历史上以语言文字形式记载和流传的知识占知识总量的80%以上NLPR,CAS-IA宗成庆:《自然语言理解》讲义1.11.1问题的提出问题的提出NLPR,CAS-IA宗成庆:《自然语言理解》讲义1.1.
3、11问题的提出问题的提出无处不在的网络、无处不在的通讯和堆积如山的文档,构成了当今社会信息爆炸的基本特征。当现代化的信息传播手段给人们的生活和工作带来极大便利的同时,也使人们面临许多难以克服的困难和障碍。有关专家指出,语言障碍是21世纪社会全球化所面临的主要困难之一。NLPR,CAS-IA宗成庆:《自然语言理解》讲义1.11.1问题的提出问题的提出©如何让计算机实现自动的或人机互助的语言处理功能?©如何让计算机实现海量语言信息的自动处理、知识挖掘和有效利用?自然语言理解自然语言理解NaturalLanguageUnders
4、tanding,NLUNaturalLanguageUnderstanding,NLUNLPR,CAS-IA宗成庆:《自然语言理解》讲义1.1.22基本概念基本概念ßß定义定义11--11::自然语言理解自然语言理解(NaturalLanguage(NaturalLanguageUnderstanding,NLU)Understanding,NLU)自然语言理解也称自然语言处理((NaturalNaturalLanguageProcessing,NLP)LanguageProcessing,NLP)。自然语言处理就是利用计
5、算机为工具对人类特有的书面形式和口头形式的自然语言的信息进行各种类型处理和加工的技术。-冯志伟《自然语言的计算机处理》NLPR,CAS-IA宗成庆:《自然语言理解》讲义1.1.22基本概念基本概念自然语言处理可以定义为研究在人与人交际中以及在人与计算机交际中的语言问题的一门学科。自然语言处理要研制表示语言能力(linguisticcompetence)和语言应用(linguisticperformance)的模型,建立计算框架来实现这样的语言模型,提出相应的方法来不断地完善这样的语言模型,根据这样的语言模型设计各种实用系统
6、,并探讨这些实用系统的评测技术。-马纳瑞斯(BillManaris)在《从人-机交互的角度看自然语言处理》NLPR,CAS-IA宗成庆:《自然语言理解》讲义1.1.22基本概念基本概念ß定义1-2:语言学(linguistics)是指对语言的科学研究。-戴维•克里斯特尔,《现代语言学词典》研究语言的本质、结构和发展规律的科学。-商务印书馆,《现代汉语词典》语音和文字是语言的两个基本属性。NLPR,CAS-IA宗成庆:《自然语言理解》讲义1.1.22基本概念基本概念作为一门纯理论的学科,语言学在近期获得了快速发展,尤其从上个
7、世纪60年代起,已经成为一门知晓度很高的广泛教授的学科。包括:历时语言学(diachroniclinguistics)或称历史语言学(historicallinguistics)、共时语言学(synchroniclinguistics)、描述语言学(descriptivelinguistics)、对比语言学(contrastivelinguistics)、结构语言学(structurallinguistics)等等。NLPR,CAS-IA宗成庆:《自然语言理解》讲义1.1.22基本概念基本概念ß定义1-3:语音学(phon
8、etics)研究人类发音特点,特别是语音发音特点,并提出各种语音描述、分类和转写方法的科学。包括:(1)发音语音学(articulatoryphonetics),研究发音器官如何产生语音;(2)声学语音学(acousticphonetics),研究口耳之间传递语音的物理属性;(3)听觉语音学(audit