欢迎来到天天文库
浏览记录
ID:34806606
大小:3.62 MB
页数:99页
时间:2019-03-11
《试论中文突发事件新闻自动摘要的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、上海交通大学硕士学位论文中文突发事件新闻自动摘要的研究姓名:周凯申请学位级别:硕士专业:计算机应用技术指导教师:李芳20080101上海交通大学硕士学位论文摘要中文突发事件新闻自动摘要的研究摘要事件自动摘要的研究是事件信息抽取技术与自动摘要技术结合的产物,其任务是从事件新闻中抽取一些与事件相关的重要信息,采用不同的技术组织这些信息,最终生成易于人们理解的事件摘要。研究突发事件自动摘要,本文进行了如下一些有益的探索:(1)提出了一种基于句子特征和模糊推断的单篇新闻报道自动摘要方法,该方法综合了与领域无关的基于句子特征分析的摘要方法和基于领域知识采用模糊推断的摘要方法。(2)研究了突发事
2、件摘要实现的方法,基于单篇新闻报道自动摘要的结果,采用句子聚类,句子选择等技术。在中文突发事件新闻语料库上进行了实验,结果表明:基于句子特征和模糊推断的新闻报道自动摘要方法能够有效地描述报道的主题,基于句子聚类技术的中文突发事件新闻摘要可以概括事件的要点,该摘要技术也已成功地应用于用户兴趣的概括(Intel项目)。关键词:事件自动摘要,句子特征,模糊推断机制,信息抽取。I上海交通大学硕士学位论文ABSTRACTTHERESEARCHONEVENTSUMMARIZATIONFORCHINESEBREAKINGNEWSABSTRACTThegoalofautomaticeventsumm
3、arizationistoextractimportantandrelevantinformationfromonlinenewsandpresentaneventtotheuserinacondensedform.Mostoftheconventionalsentenceextractionsummarizationmethodseitherextractimportantsentencesfromunstructureddocuments,ordrawrelevantsentencesaccordingtosomespecificknowledge.Theformermethod
4、sextractinformationbymaximizingthefeaturesofdocuments,whicharedomain-independent.Thelattermethodsextractinformationbymaximizingtherelevancebetweendocumentsandsomedomainknowledge.However,somedomain-independentmethodsmayextractimportantbutirrelevantsentences,whilesomedomain-specificmethodsmayextr
5、actsomerelevantbutunimportantsentences.ThispaperproposesanovelsentenceextractionmethodforChinesebreakingnewssummarization.ItassignsafeaturescoretoeachII上海交通大学硕士学位论文ABSTRACTsentencebyanalyzingfeaturesofthesentence,suchasposition,lengthetc.Thenitutilizesfuzzyinferencemechanismtoinfersemanticrelev
6、ancebetweeneachsentenceandtheeventtopic.Itextractsbothimportantanddomain-relatedsentencestogenerateanewssummary.Basedonthis,itprocessesthesentencesinallnewssummariesbyusingclustering,rankingtechniquesandfinallygeneratesaneventsummary.ExperimentisconductedonourcorpusofChinesebreakingnews.Theresu
7、ltsindicatethatourapproachcaneffectivelysummarizeChinesebreakingnews.Inaddition,thispapersuccessfullyappliestheproposedsummarizationmethodstouser-interestanalysistopic.Keywords:eventsummarization,sentencefeatures,fuzzyinferencemec
此文档下载收益归作者所有