论语料库应用于词典释义优势与局限

论语料库应用于词典释义优势与局限

ID:6050328

大小:28.00 KB

页数:6页

时间:2018-01-01

论语料库应用于词典释义优势与局限_第1页
论语料库应用于词典释义优势与局限_第2页
论语料库应用于词典释义优势与局限_第3页
论语料库应用于词典释义优势与局限_第4页
论语料库应用于词典释义优势与局限_第5页
资源描述:

《论语料库应用于词典释义优势与局限》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、论语料库应用于词典释义优势与局限  摘要:基于语料库的词典释义新型途径是对传统释义方式的一种重要补充。本文对基于语料库进行词典释义的历史和现状研究进行分析,在此基础上阐述此类研究存在的优势和局限性。关键词:语料库;词典释义;优势;局限中图分类号:G642.0文献标志码:A文章编号:1674-9324(2013)30-0118-02近年来,随着认知语言学的发展和各语言数据库的构建,基于语料库揭示语词的语义特征和词汇关系的研究受到学界的广泛关注,随之而兴起的是基于语料库进行的词典学编纂研究。语料库在现代被认为是词典编纂过程的必要组成成分,基于语料库的词典释义新

2、型途径是对传统释义方式的一种重要补充。本文对基于语料库进行词典释义的历史和现状研究进行分析,在此基础上阐述此类研究的优势和局限性。一、语料库研究概述语言研究中的语料库是指以分析语言特征为目的而收集起来的文本集合。(Landau2005:298),有一定的结构,有代表性,可被计算机程序检索,具有一定规模。(冯志伟62009)。Sinclair(1991)认为,语言描述只有以自然语境中的真实语言为基础才能进行准确客观的描述。Biber等人(Biber,Conrad&Reppen1998:3)认为,语料库分析研究的目的不是为了判断语言语法的正确性,而是为了通过大

3、规模的语言现实数据来揭示语言使用的典型模式。Leech(1993:107)认为语料库语言学有如下特点:以语言的应用而不是语言能力为中心;以语言描写而不是语言普遍性为中心;以语言的定量及其定性模型为中心;以经验主义而不是理性主义的科学研究方法为中心。目前国际主流英语词典均采用语料库进行编纂,如CollinsCobuild词典采用Sinclair主持的COBUILD语料库,朗文ESL词典使用朗文语料库进行词典编纂,《牛津高阶学习词典》使用BNC语料库,《剑桥国际英语词典》使用剑桥国际语料库。此外,词典编纂也开始使用一些具有先进的检索分析工具和语法自动标注体系的

4、语料库,如wordsketchengine等语料库为语词提供了较为精确的词汇描述。二、利用语料库进行词典释义编纂的优势语料库应用于词典编纂研究主要存在以下几点优势:61.提供更客观的语言事实。语料库能够用来发现相关的、核心的、典型的事实(如例证、搭配等),它全面展现了母语者使用语词的自然语境,而这种语境恰好是非母语者所缺乏的语感。语料库还可显示某一语词主要用于哪些语言变体或类别中,并给词典和语法书提供了语法信息的宝贵资源,更好地对每个义项进行释义,提供真实可信的合适例证。此外语料库提供的定量和定性分析也展示了更加直观、更加可靠和更加令人信服的辨析结果,有效

5、避免了基于传统语义学理论视野的词典对词条语义分析与描述的片面性和主观性问题。2.建立使用频率。语料库的词频统计可以辅助词典选词立目,帮助词典编者决定是否收录某个语词及其词形。常用词在大型语料库中的高频出现为词典编纂者收录高频词提供了现实依据。语料库还能凸显两个词的共现频率,确定常用的语词搭配和惯用法。3.提高词典编纂效率。在计算机语料库建立之前,人们编纂词典往往采用卡片的方式费时、费力,低效地采集语料。一本大型词典往往要耗费多年才能出版。如今,计算机语料库的建立及便捷搜索工具的使用使得词典编纂者们得以在海量语料中提取词典所需的各种有效语言数据,缩短了词典编

6、纂和出版的时间,提高了语料使用和词典编纂的效率。(章宜华2012:1)三、基于语料库进行词典释义编纂存在的局限和问题61.共时语料库选取时段的问题。目前语料库的建设主要以共时为主。这里就存在一个共时语料库选取时段的问题。如果不能确定共时的时段,对词典编纂将会产生诸多问题。比如语词的时代标签的问题。某些语词多长时间被定义为过时?多长时间被定义为旧,都应该有一个标准。此外,随着时间的变化,某些语词的标签也会发生变化,如方言进入共同语词汇,经过一段稳定期,成为共同语的一部分。拿《现代汉语词典第5版》作为例子来说。该词典将“忽悠”一词标注为,然而笔者认为,该词标为

7、更合适。词典的标签要考虑到历史的演变而及时进行更新,就要参考语料库。而语料库则存在一个时限的问题。如果收录50年以上的语料库,能否还被当成共时语料库?“忽悠”一词在50年中以方言的形式出现的频率多于共同语,而10年间以共同语的形式出现频率则更高。如果在50年以上的语料库中进行词典标签的标注,则会出现标注不准确的问题。2.词典编纂选用真实语料的问题。词典编纂究竟是采用自撰例还是语料库的真实例子历来就有纷争。Landau认为,自撰例不是人们在实际生活中说的话,很多自撰例甚至从未使用过,对二语习得者来说更达不到习得真实语言的目的。因此,他提出在词典中采用真实语料

8、比自撰例要好。然而真实语料也有缺陷。其一,真实语料受具体语境的限制

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。