基于自然语言处理的多源POI数据融合的研究

基于自然语言处理的多源POI数据融合的研究

ID:36684668

大小:5.73 MB

页数:66页

时间:2019-05-13

基于自然语言处理的多源POI数据融合的研究_第1页
基于自然语言处理的多源POI数据融合的研究_第2页
基于自然语言处理的多源POI数据融合的研究_第3页
基于自然语言处理的多源POI数据融合的研究_第4页
基于自然语言处理的多源POI数据融合的研究_第5页
资源描述:

《基于自然语言处理的多源POI数据融合的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、基于自然语言处理的多源POI数据融合的研究学位论文答辩日期:一.枷l;、}:码指剥币繇一塑答辩委员会成员签字:谨以此文献给尊敬的张巍副教授以及我亲爱的朋友和同学们l⋯⋯⋯⋯~李瑞姗独创声明本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。据我所知,除了文中特另tlDl:i以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也刁i包含未获得l洼;塑造直墓丝盂蔓挂别直明的:奎拦堕窒2或其他教育机构的学位或证书使用过的材料。与我一同工作的同志对本矽I:究所做的任何贡献均已在论文中作了明确的说明并表示谢意。学位论文作者繇奄瑞降字隰wl;年≥月哆目学位论文版

2、权使用授权书本学位论文作者完全了解学校有关保留、使用学位论文的规定,有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借阅。本人授权学校可以将学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。同时授权中国科学技术信息研究所将本学位论文收录到《中国学位论文全文数据库》,并通过例络向社会公众提供信息服务。(保密的学位论文在解密后适用本授权书)学位论文作者繇耆瑞明翩箨可签字口期:厶吖;年岁月哆日签字日期:沙1'年扩月哆口知识产权保护协议依据《中华人民共和国促进科技成果转化法》第二十八条和《中国海洋大辜蕊凳墓黑嚣竺躞!兰赫然

3、燃喾事宜达成如下协议:l、研究生在校期间从事科研工作所完成的学位论文以及不论是否写入学位论文的其他成果属职务成果。研究生不得对上述职务成果以自己或他人名义擅自向第三方转让或泄漏。2、研究生离校后三年内,不得擅自将在校期间从事科研工作的相关数据、研究结果和相关技术发表论文,不得擅自向第三方转让或泄漏。3、研究生离校后三年内,若进行重复及延续在校研究课题的科技项目,必须经导师及中国海洋大学同意并协商知识产权分享事宜后,方可开展工作。4、若研究生违反上述规定,导师及中国海洋大学有权追究其法律责任,即:要求其停止侵权行为、公开消除影响并予以经济赔偿。5、本协议双方签字之日起生效,有效期三年。~辫

4、,静蛹71弓年}月/。日矽房基于自然语言处理的多源POI数据融合的研究1摘要近年来,由于基于位置的服务快速发展,尤其是对网络电予地图、移动位置服务(LBS)、便携式自动导航(PND)的使用,原有的兴趣点(P01)很难继续支撑这类服务。能否获取高质量的POI信息,成为此类服务的命脉所在。随着人们持币消费能力在迅猛增K,在日常消费、出行时,会将更多的注意力放在餐饮、娱乐、旅游等领域。这种不断增长的消费能力催生出了许多面向这一领域的信息提供商,他们所提供的信息内容丰富,并且实时性相对很高。结合

5、.^述背景,如何获取蕴含在web中的大量有价值的POI信息点成为如今的一个热点问题,对这些已有的PO

6、I信息进行校正、融合,得到有利用价值的规整数据,这些工作具有重大的理论意义和实际的现实意义。本文在多源POI数据融合方面,包括POI各特征字段的表示、-口J’融合POI的分类、经纬度字段的统一、嘲络访问受限等方而,进行了深入而系统的研究,具体的研究工作和研究成果如下:(1)通过分析POI中各特征字段的形式、特点,提出了POI特征相似度用以表示待分类POI与原有POI集的关系,以此进行之后的判断依据。相似度的形式化表示主要由名称、地理信息相似度两部分组成,其中的地理信息包括POI中的地址和经纬度。名称部分是通过几种经典字符串匹配方法计算得出的,地址部分根据地址的相似计算得出,经纬度部分利用

7、POI之间的距离得出。(2)文中用到的POI中的经纬度是来源于不同网络电子地图上的坐标,同一实体在不同地图上的坐标不一致,对之后的POI融合_[作造成了一定的影响。为解决这个经纬度标准不统一的问题,本文提到两种解决方法,即基于纠偏表的方法和基于API的方法。(3)构建了一个基于规则的分类模型,构建过程中设置POI各字段内部系数及阈值,经过回归计算,选取其区分POI是否可融合效果最好的一组系数和阈值构建出了判定模型。这个计算过程复杂、耗时,并且不够灵活,不具备自动学习的能力。因此本文又利用机器学习分类器自身主动学习的能力,构造了几种不1SupportedbytheNationalNatur

8、alScienceFoundationofChinaunderGritNo.60602017(国家自然科学基金);NaturalScienceFoundationofShandongProvinceunderGrantNo.ZR2012FM016(III东省自然科学基金)II同的分类模型,比较之后选出了较优分类器,而实现分类性能的有效提升。论文创新点如下:(1)考虑到冈为词语的存在使得不同汉字具有不同的关联性,本文假设中文字符串匹配

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。