基于潜在语义分析与多特征融合的中文机构名识别

基于潜在语义分析与多特征融合的中文机构名识别

ID:35067505

大小:6.14 MB

页数:68页

时间:2019-03-17

基于潜在语义分析与多特征融合的中文机构名识别_第1页
基于潜在语义分析与多特征融合的中文机构名识别_第2页
基于潜在语义分析与多特征融合的中文机构名识别_第3页
基于潜在语义分析与多特征融合的中文机构名识别_第4页
基于潜在语义分析与多特征融合的中文机构名识别_第5页
资源描述:

《基于潜在语义分析与多特征融合的中文机构名识别》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、分类号:罪学校代码:麵^201320903密级:公开学号:硕±亨恆巧交MASTER’SDISSERTATION基于潜在语义分析与多特征諫合的中文机构為识别-;.-r-C..S4'一.-.、,*.?.?.v.V‘t'V‘;碱V巧’W、:,学科义称通信与信息系统作者::刘路指导老师影进业西北大学学位评定委员会二〇—六年I_ChineseOranizationNameReconitionggBasedonLaf:entSeman村cAnalsisandyMultiple

2、FeaturesfiisionAthesissubmited化NorthwestUniversityinartialfulfillmentoftherequirementspfor出eCommunicationandInformationSystemByLiuLuSupervisor:PengJiney2016西北大学学位论文知巧产枚黄明书本人完全了解西北大学关于收集、保存、使用学位论文的规定。学校有权保留并向国家有关部口或机构送交论文的复印件和电子版。本人允许论文被查阅和借阅。本人授权西北大学

3、可W将本学位论文的全部或部分内容编入有关数据库进行检索,可1^采用影印、缩印或扫描等复制手段保存和汇编本学位论文。同时授权中国科学技术信息研究所等机构将本学位论文收录到《中国学位论文全文数据库》或其它相关数据库。保密论文待解密后适用本明。^^-学位论文作者签名:^指导教师签名;分年/月^日年/月^日西北大学学位论文独创性黄明本人声明:所呈交的学位论文是本人在导师指导下进行的研巧工作及。取得的研究成果据我所知,除了文中待别加W标注和致谢的地方外,本论文不包含其他人已经发表或撰写过的研究成果,也不包含为获得西北大一学或其它教育机构的学位

4、或化书而使用过的材料。与我同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。学位论文作者签名;/月年//曰I摘要命名实体识别在自然语言处理技术的发展过程中占据至关重要的地位,己经广泛应用于信息检索、数据挖掘、机器翻译、信息抽取等互联网的多个研巧方向。中文机构名识别作为中文信息处理技术的重点和难点,国内外学者相继提出很多方法,然而识别准确率仍然难^。因此,本文提出基于潜在语义分析与多特(^满足人们在实际应用中的需求征融合的中文机构名识别方法。主要内容如下:一LDAL(1)本文通过对现有序列标注方法的研究,提出了种基于

5、(atentDili浊letAllocation)与CRF(ConditionalRandomReids)的序列标注方法。该方法首先利用LDA进行模型训练,将其主题概率作为CRF模型训练的特征,能够在提取字、词等基本特一征的同时多个反映文本主题的特征,,从而提高序列标注的准确度。此外该方法和语,。料的相关性较低具有良好的扩展性,同时也减少了人工干预(2)本文通过研巧机构名称的特点及类型,将其分为H类:机构名简称、简单机构名称和嵌套的机构名称。本文针对嵌套机构名的组成结构及特点,提出了正反两次检。索标注序列的识别算法,最后采用排错模式特征过滤识别结

6、果通过实验验证了本文方法在人民日报、BCC化及CCL等语料上均获得了较高的识别准确率。;,关键词命名实体识别,机构名识别,条件随机场潜在狄利克雷分布,模型训练i4ABSTRACTTheNamedE打tityRecognitio打playskeyfimctioninthedevelopmentofthenaturallanguageprocessingt:echnologywhichhasbealiedinmanInternetiresearchessuchasInformation,ppy,Retrie

7、valDataMininMachineTranslationandInformationExtraction.Asthekeoint,g,ypanddificultiesinChineseinformationroce化inscholarsathomeandabroadhavepg,’proposedmanyexcelle打tsolutionswhilereconitio打accuracstillcanno

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。