哈萨克语句法分析辅助特征提取研究

哈萨克语句法分析辅助特征提取研究

ID:34318198

大小:2.89 MB

页数:46页

时间:2019-03-05

哈萨克语句法分析辅助特征提取研究_第1页
哈萨克语句法分析辅助特征提取研究_第2页
哈萨克语句法分析辅助特征提取研究_第3页
哈萨克语句法分析辅助特征提取研究_第4页
哈萨克语句法分析辅助特征提取研究_第5页
资源描述:

《哈萨克语句法分析辅助特征提取研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、新疆大学硕士研究生学位论文硕士研究生学位论文新疆大学论文题目(中文):哈萨克语句法分析辅助特征提取研究论文题目(外文):ResearchonKazakhSyntacticParsingAuxiliaryFeatureExtraction研究生姓名:陈雪学科、专业:工学、计算机应用技术研究方向:自然语言处理导师姓名职称:古丽拉·阿东别克教授论文答辩日期年月日学位授予日期年月日新疆大学硕士研究生学位论文摘要哈萨克语的信息处理目前已经完成了基本短语自动识别、固定短语抽取和词性标注。本文对哈萨克语进行短语结构的句法分析研究,主要采用了基于移进-归约的句法分析方法,使用感知器算法

2、和柱搜索算法在句法分析过程中进行训练与解码,并通过加入神经网络为解码过程添加辅助特征,帮助更高效地解析出哈萨克语句法结构。本文的主要研究工作如下:1.在哈萨克语句法分析过程中,以基于移进-归约的句法分析方法为整体框架,通过每一步的移进-归约动作,最终得出哈萨克语短语结构的句法树。2.在哈萨克语句法分析训练阶段,采用感知器算法对标准的哈萨克语句法结构的句子进行训练,传统的句法分析主要依赖语言的规则库,而感知器算法训练是一个不断调整参数不断学习哈萨克语句子特征的过程。它初始化参数向量全为零,并通过对训练样本进行解码来更新参数。3.在哈萨克语句法分析解码阶段,采用柱搜索算法进

3、行解码,在解析句子过程中,通过放弃一些权重比较小的小概率节点,来控制搜索空间的大小,以获得概率较大的句法树。既控制了解码过程中所占用的搜索空间,又通过统计的方法获得最合适的句法树。4.在解码过程中通过神经网络添加辅助特征,在解析句子过程中,本文构建了一个双向LSTM模型,利用它提取句子中每个单词之间组成结构的信息,以预测每个单词在句法树中的句法组成部分,然后将结果作为辅助特征传递给句法分析过程,帮助生成哈萨克语句法树。经实验证明,使用基于移进-归约的句法分析方法可以解析出哈萨克语句法结构,对于句法分析过程中使用神经网络提取一些辅助特征来辅助解码后,在解析速度和准确性上都

4、有所提高。关键词:哈萨克语;移进-归约;解码算法;感知器算法;神经网络;辅助特征I新疆大学硕士研究生学位论文AbstractTheprocessingofKazakhlanguagehasnowcompletedbasicphraseautomaticrecognition,fixedphraseextraction,andpart-of-speechtagging.ThispaperfocusesontheparsingofthephrasestructureinKazakhlanguage.Thisarticlemainlyadoptsthesyntacticpar

5、singmethodbasedonshift-reduce,usesperceptronalgorithmandbeam-searchalgorithmtotrainanddecodeintheprocessofsyntacticparsing,andaddsneuralnetworktoaddauxiliaryfeaturesforthedecodingprocesstohelpgenerateKazakhsyntacticstructuremoreefficiently.Themainresearchworkofthispaperisasfollows:1.Inth

6、eKazakhsyntacticparsingprocess,themethodbasedonshift-reduceisusedastheoverallframework,andthesyntactictreeofKazakhphrasestructureisfinallyobtainedthroughtheshift-reduceactionofeachstep.2.IntheKazakhsyntacticparsingtrainingstage,theperceptronalgorithmisusedtotrainthesentencesofthestandard

7、Kazakhsentencestructure.Thetraditionalsyntacticparsingmainlyreliesonthelanguagerulebase,andtheperceptronalgorithmtrainingisacontinuousadjustmentparametertocontinuouslylearntheKazakhsentence.Itinitializestheparametervectortozeroandupdatestheparametersbydecodingthetrainings

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。