基于深度学习的问题分类的研究

基于深度学习的问题分类的研究

ID:35067434

大小:2.36 MB

页数:78页

时间:2019-03-17

基于深度学习的问题分类的研究_第1页
基于深度学习的问题分类的研究_第2页
基于深度学习的问题分类的研究_第3页
基于深度学习的问题分类的研究_第4页
基于深度学习的问题分类的研究_第5页
资源描述:

《基于深度学习的问题分类的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、硕士学位论文基于深度学习的问题分类的研究QUESTIONCLASSIFICATIONBASEDONDEEPLEARNING周鑫鹏哈尔滨工业大学2016年6月国内图书分类号:TP391.2学校代码:10213国际图书分类号:681.37密级:公开工学硕士学位论文基于深度学习的问题分类的研究硕士研究生:周鑫鹏导师:赵铁军教授申请学位:工学硕士学科:计算机科学与技术所在单位:计算机科学与技术学院答辩日期:2016年6月授予学位单位:哈尔滨工业大学ClassifiedIndex:TP391.2U.D.C.:681.37Dissertat

2、ionfortheMasterDegreeinEngineeringQUESTIONCLASSIFICATIONBASEDONDEEPLEARNINGCandidate:ZhouXinpengSupervisor:Prof.ZhaoTiejunAcademicDegreeAppliedfor:MasterofEngineeringSpeciality:ComputerScienceandTechnologyAffiliation:SchoolofComputerScienceandTechnologyDateofDefence:

3、June,2016Degree-Conferring-Institution:HarbinInstituteofTechnology哈尔滨工业大学工学硕士学位论文摘要问题分类(QC)是智能问答系统的关键技术之一。问题分类与文本分类相似,其目标是为每一个自然语言问句分配一个类别标签,此类别代表的是问句期望的最终答案的类型,在问答系统中通过问题的类别信息对候选答案进行约束和过滤。近年来,随着问答系统的发展,问题分类越来越受到研究学者的关注。早期,学者们研究了基于规则的问题分类方法,由于规则不具有通用性,后来逐渐转变为基于机器学习的问

4、题分类研究方法。在基于机器学习的研究方法中,最初研究人员主要探索了基于支持向量机(SVM)和最大熵模型(ME)在问题分类中的应用;目前,基于机器学习的问题分类模型存在几点不足之处:(1)传统机器学习方法(SVM,ME)处理的是定长数据,在将长度长短不一的问句转换为定长特征时会造成信息的丢失;(2)目前的研究方法没有考虑数据的领域信息,数据的领域差别会造成分类器性能的下降。针对上述问题,本文中我们提出了基于深层神经网络模型的问题分类方法,首先我们提出了一种基于特征融合的深层神经网络分类模型。在分类模型中,我们使用句子的unigra

5、m词语特征、词性特征以及TermWeight特征;分类网络的输入为多种特征向量融合得到的词嵌入;为解决句子长度长短不一的问题,网络中使用了BLSTM作为网络的隐含层,然后分别通过pooling层和softmax层完成从隐含层的输出结果中提取句子特征和对句子分类的工作。实验证明,通过融合多种句子特征,课题中提出的方法能够取得较好的分类结果,在粗粒度分类(coarse)和细粒度分类(fine)上分类准确率能达到94.0%和88.2%。其次,我们研究了领域自适应对问题分类的影响,领域自适应分类模型使用未标记的目标领域数据作为训练数据,

6、通过预测句子的领域标签降低领域信息对分类器分类性能的影响,从而得到具有领域泛化性的分类模型。实验证明,通过考虑领域自适应,分类器的性能得到了进一步提高,粗粒度分类(coarse)和细粒度分类(fine)上的分类准确率分别提高了0.4%和1.2%。关键词问题分类;LSTM;特征融合;领域自适应;-I-哈尔滨工业大学工学硕士学位论文AbstractQuestionclassification(QC)hasasignificantroleinautomatedQAsystems.QCistolabelaquestionintoacla

7、sswhichrepresentstheanswertype.Theselectedquestiontypecanbeusedforfilteringthecandidateanswers.Inrecentyears,moreandmoreresearcherspayattentiontotheresearchofQC.Intheearlyperiod,themainmethodofQCistherule-basedapproach,andlater,researchersturntothemachinelearningappr

8、oacheswhichproducesbetterresultthantherule-basedonewhichisn’tuniversal.Thesupportvectormachine(SVM)andmaximumentropymodels(ME)areth

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。