关于现代汉语词语的语法功能分类.doc

关于现代汉语词语的语法功能分类.doc

ID:56673841

大小:74.50 KB

页数:9页

时间:2020-07-04

关于现代汉语词语的语法功能分类.doc_第1页
关于现代汉语词语的语法功能分类.doc_第2页
关于现代汉语词语的语法功能分类.doc_第3页
关于现代汉语词语的语法功能分类.doc_第4页
关于现代汉语词语的语法功能分类.doc_第5页
资源描述:

《关于现代汉语词语的语法功能分类.doc》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、`关于现代汉语词语的语法功能分类 俞士汶 关键词:语言信息处理、现代汉语、词类、语法功能 一.  信息处理用现代汉语词语分类体系在朱德熙先生的语法理论的指导下, 北大计算语言学研究所与中文系合作, 经过几年的研究, 提出了一个服务于语言信息处理的现代汉语词语分类体系, 并将五万多条的词语实际进行了归类, 与此同时还按类详细描述了每个词语的多种语法属性, 初步建成了“现代汉语语法信息词典”, 另外对数十万字的语料进行了切分和词性标注。这就又进一步检验了词类划分的科学性与可操作性。达到如此规模和如此深度的汉语语言工程实践可能是罕见的。本文

2、介绍现代汉语词语分类体系、分类的理论基础, 并以若干词类为例详细介绍具体的划类准则。    现代汉语的词分为以下18个基本词类, 括号中的拉丁字母是各类词的代码。    名词(n), 时间词(t), 处所词(s), 方位词(f),  数词(m), 量词(q), 区别词(b), 代词(r), 动词(v), 形容词(a), 状态词(z), 副词(d), 介词(p), 连词(c), 助词(u), 语气词(y), 拟声词(o), 叹词(e)。    这些基本词类可以合并为较大的词类。名词、时间词、处所词、方位词、数词、量词统称为体词, 动词、

3、形容词、状态词统称为谓词。有一部分代词属于体词, 另一部分代词属于谓词。体词、谓词、区别词和副词又合称为实词。介词、连词、助词、语气词合称为虚词。实词与虚词是汉语的两大词类。此外还有拟声词与叹词, 它们游离于这两大词类之外。自然语言处理的常规技术要求在自然语言处理系统中配备一部电子词典。对于计算机系统来说, 可以认为作为电子词典的登录项的语言单位是“词”。其部分肯定是语言学家认同的词, 这也就是暗示了其中还有一部分不能看作“词”。从计算机处理实际文本的需要出发,从提高计算机处理效率的角度考虑,词典中另外包含了以下7类语言成分:前接成分

4、(h): 阿, 老, 非, 超, 单后接成分(k): 儿, 子, 性, 员, 器语素字  (g): 民, 衣, 失, 遥, 郝非语素字(x): 鸳, 枇, 蚣成语    (i): 按部就班, 八拜之交习用语  (l): 总而言之, 由此可见简称略语(j): 三好, 全总    前4类是比“词”更小的单位,不成词。这些成分的数量是有限的,只要电子词典的规模允许,应当尽可能地将这些成分全部收入。后3类是比“词”更大的单位, 词典中只能收一部分使用频率高的。本文将电子词典中登录的各种语言成分笼统地叫做“词语”。    以下行文中的“词类”是

5、就前面的18个基本词类而言的, 有时也讨论上述后7类语言成分。 二.  词语分类的理论基础Word文档`2.1分类的目的与依据    为了进行语法研究与信息处理, 需要把语法功能相同的或者相近的词归成一类。这里包含两项工作。一项是要针对汉语词语的全集, 按照某种标准, 建立一个分类体系。第一章所介绍的就是面向信息处理的一种汉语词语分类体系。另一项工作是决定该全集中的每一个词语究竟属于哪一个词类, 这项工作可以叫“归类”, 不过人们习惯上也在“归类”的意义上使用“分类”这个术语。    如果面向人的语言研究,词语分类尚不十分迫切的话,那

6、么面向计算机的语言研究, 词语的语法分类及其代码化几乎是不可缺少的。词语分类实际上是将最重要的语法知识与语法规则条理化, 从而为自然语言的分析与生成提供最重要的线索。    划分词类的本质根据只能是词的语法功能。所谓词的语法功能主要是指:(1)和某个或某类词语组合的能力;(2)在句法结构中充当句法成分的能力。例如, 考察具有如下语法功能的词。a. 可以用作主谓结构中的谓语,但不能带真宾语。如“个子高,教室安静”中的“高, 安静”是谓语。象“高三公分, 安静了两天” 中的数量短语 “三公分,两天”是准宾语,而不是真宾语。b. 可以受“很

7、”一类程度副词修饰,如“很高,挺安静,特别雄伟”。c. 可以作述补结构中的补语,如“洗干净,捆得结实”中的“干净、结实”是补语。d. 直接或加“地”后作状中结构中的状语, 如“迅速提高, 安全地转移”中的“迅速、安全”是状语。e. 直接或加“的”后作定中结构中的定语, 如“漂亮小姐, 挺拔的山峰”中的“漂亮、挺拔”是定语。f. 可以用 a+“不”+a 的形式提问,如“硬不硬,痛苦不痛苦”。g. 后可接语气词“着呢”,如“美着呢,痛快着呢”。       :       :    可将这样的词归成一类, 起个名字叫“形容词”, 并用一个

8、代码“a”表示。这样, 如果判明了一个词具有上述功能, 则可以将它归入形容词; 反之, 如果能从汉语语法信息词典查得某个词的词类代码是“a”, 则知它很可能具有上述语法功能, 除非汉语语法信息词典对其中某些词的某些语法功

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。