词典多义词义项关系与词义区分

词典多义词义项关系与词义区分

ID:37700821

大小:495.36 KB

页数:7页

时间:2019-05-29

词典多义词义项关系与词义区分_第1页
词典多义词义项关系与词义区分_第2页
词典多义词义项关系与词义区分_第3页
词典多义词义项关系与词义区分_第4页
词典多义词义项关系与词义区分_第5页
资源描述:

《词典多义词义项关系与词义区分》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、万方数据2010年1月第42卷第1期云南师范大学学报(哲学社会科学版)Jan.,2010V01.42No.1【主持人语】本期的“语言国情研究”栏目关注汉语的语言信息处理研究,特别是词汇语义的计算机处理。在自然语言中,一词多义是非常普遍的现象,因此要实现对文本内容的理解和自动处理,必须面对如何识别多义词的不同词义这个问题。词义消歧研究就是为解决这个问题而产生的,并随着研究的发展,逐渐成为自然语言处理的基础性工作,是许多基于内容理解的自然语言处理任务的必要环节。在词义消歧研究中,词义知识来源、消歧线索、消歧

2、方法是需要特别关注的问题。词典是词义消歧最常用最基本的知识来源,但由于传统词典是面向人的使用而设计的,用于计算机处理时,有诸多问题需要解决,例如义项分立规则的不明确、义项之间的区分线索不清晰等。在消歧线索方面,词类、搭配、释义文本都是常用的信息,其中词类的作用举足轻重,有助于大幅降低歧义消解的复杂度。在具体的消歧方法上,偏向计算机或语言学的研究者侧重点有所不同,侧重语言学依据的研究者强调通过分析多义词的性质寻找更有针对性的消歧方法。本期的三篇论文分别聚焦于这几个点,依次讨论了多义词义项划分、使用词类区分

3、词义和多义动词的消歧策略,希望这些讨论有助于吸引更多学者关注汉语语言信息处理研究,推动汉语的信息化进程。(本期栏目学科主持人简介:靳光瑾(1952一),女,博士,教育部语言文字应用研究所研究员,教育部语言文字应用研究所副所长,国家语委语言文字规范标准测查认证中心主任,中国辞书学会副会长。主要研究方向为计算机语言学)词典多义词义项关系与词义区分+肖航(教育部语言文字应用研究所,北京100010)[摘要]从为语料库标注多义词词义的实践来看,词典普遍存在词义可区分性不足的情况。根据对《现代汉语词典》的分析,本

4、文认为词典中多义词的义项之间存在重叠、相离、包含等关系,这些关系对词义的准确区分带来不利影响,具体表现为词义区分线索不足、义项缺失等形式,降低了词义区分的准确率和可操作性。本文结合词义标注语料数据对这些表现分别进行了分析,指出厚清多义词义项之间的关系、改善词义可区分性能够提高词义消歧的准确率,同时有助于提高词典编纂的质量。[关键词]义项划分;词义区分;词义标注;多义词;语料库[中图分类号]Ho—05[文献标识码]A[文章编号]1000一5110(2010)Ol—004l—06一、引言通过对语料库标注多义

5、词词义是检验词典义项划分合理性和完备性的主要方式之一;03同时,建设大规模词义标注语料库也是自然语言处理研究的一个重要任务。[2]一般而言,语料库词义标注是指给语料中的多义词标注正确的词义,为语料库添加词汇语义标记的过程。词义标注语料库在词典编纂、语言处理研究中起着基础性资源的作用。词义的可区分性及区分方式是词义标注和词义消歧研究的核心问题。词义标注研究在词义体系的选择上存在采用传统语文词典、语义词典等不同的方式。以词典作为词义体系,词义标注必须面对词典义项划分中的问题。从现有的研究来看,词义标注主要存

6、在两大难点,都与词典的义项划分情况有关。第一个难点是词典的义项划分是否具有足够的清晰度,具有足够多的区分线索。根据词典标注词义,势必要了解词典的释义过程,特别是释义的规则和义项分立的原则,而从目前词典释义本身来看,很多多义词的词义之间区分·[收稿El期]2009—12—28[作者简介]肖航(1974一),男,福建尤溪人,教育部语言文字应用研究所助理研究员,新加坡国立大学研究生毕业,研究方向为计算语言学。万方数据·42·云南师范大学学报(哲学社会科学版)第42卷线索不够清晰,词义标注很难达到高准确率。[3

7、]根据调查,母语人也无法只依据词典释义为语料中的全部多义词标注准确词义,不同标注者之间的标注一致性非常低;这种情况不仅限于某种特定语言,英语、汉语等不同语言的词典都存在同样的问题。[4]第二个难点是多义词义项划分是否完备,是否能够涵盖词语的语言使用情况。Es],[6]标注过程中具体表现为词典给出的词义并不能覆盖语料库中词语所有使用情况,无法对语料中的所有词标注准确的词典义项。因此,对语言处理研究而言,词典的义项划分需要有更为明确的规则和方法。[7]从词典学角度看,Wierzibicka等人认为词典学家在

8、解释一个词的词义时,通常只能找到一个原型,通过对原型的描述解释词义,词汇在原型之外的变化并不能得到全面的解释。[8]词典并不是为完备的列出词义而设计的。词义标注的实践证明,根据词典自动或人工标注词义,并不是一个单纯的语言处理研究,要解决词义标注过程中的问题,必须从分析词典释义人手。[9].[10]通过语料标注实践,本文认为,上述两个难点可以通过多义词义项之间存在的语义和逻辑关系表现出来,因而分析多义词义项之间存在的关系对寻找有效区分词义的方

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。