基于统计学方法的地址标准化模型的建立.pdf

基于统计学方法的地址标准化模型的建立.pdf

ID:50154479

大小:8.64 MB

页数:69页

时间:2020-03-07

基于统计学方法的地址标准化模型的建立.pdf_第1页
基于统计学方法的地址标准化模型的建立.pdf_第2页
基于统计学方法的地址标准化模型的建立.pdf_第3页
基于统计学方法的地址标准化模型的建立.pdf_第4页
基于统计学方法的地址标准化模型的建立.pdf_第5页
资源描述:

《基于统计学方法的地址标准化模型的建立.pdf》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、分类号密级公开编号擘碎士研究嗲傈讼式题目基于统计学方法的地址标准化模型祖学院(所、中心)鮮球十辦专业名称概率论与数理统计研究生姓名简荣杰学号导师姓名孟捷职称教年月论文独创性声明及使用授权本论文是作者在导师指导下取得的研宄成果。除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,不存在剽窃或抄袭行为。与作者一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。现就论文的使用对云南大学授权如下:学校有权保留本论文(含电子版),也可以采用影印、缩印或其他复制手段保存论文;学校有权公布论文的全

2、部或部分内容,可以将论文用于査阅或借阅服务;学校有权向有关机构送交学位论文用于学术规范审查、社会监督或评奖;学校有权将学位论文的全部或部分内容录入有关数据库用于检索服务。内部或保密的论文在解密后应遘循此规定)摘要随着信息化进程的加快,各企事业单位、政府职能部门迫切需要将非空间数据与空间数据进行整合,实现非空间数据的可视化,用于日常工作的决策。为了将这些非空间信息与空间信息进行融合,就需要建立它们之间的联系,而地理编码是实现这种联系的重要手段。地理编码的目的是将地理坐标赋予地址位置(如街道地址)。由于现实世界中地址数据的复杂性和不规范性,

3、因此开展地理编码工作前,需要建立地址标准化模型,才能对地址数据进行匹配,从而赋予地理坐标。目前,困扰我国地理编码进程的主要的问题是缺少标准化的地址模型。本文提出了单位、地址级别和级别地址的概念,利用统计学方法建立了统计量和。利用统计量判断、截取地址关键词。利用判别法和统计量辨别二级地址真伪,然后对各级地址进行编码,在此基础上建立了标准化的地址模型。关键词:地理编码;地址级别;地址标准化模型;统计学方法AbstractAlongwiththespeedingupoftheinformatizationprocess,allenterpri

4、sesandinstitutions,governmentfiinctionaldepartmentsurgentlyneedtointegratethenon-spatialdataandspatialdatatorealizenon-spatialdatavisualizationwhichisusedfordailyworkdecision-making.Inordertointegratenon-spatialinformationandspatialinformation,weneedtoestablishtheconnect

5、ionbetweenthem,andgeocodingistheimportantmeanstorealizethisconnection.Thepurposeofgeocodingisendowsaddresslocationgeographiccoordinates(e.g.,astreetaddress).Inrealworld,becausethecomplexityandnon-normalizationofaddressdata,sobeforeconductofgeocodingwork,weneedtobuildaddr

6、essstandardizationmodel,weonlythenmaymatchaddressdataandthusendowinggeographiccoordinates.Atpresent,,,:目录第一章绪论§研宄背景§研宄意义§美国地址数据标准化的发展§我国地址的现状§北京大学数字地球工作室对地址模型的研究第二章分词方法的介绍§机械分词法§统计分词方法第三章统计学方法在地址标准化模型中的应用§建立地址标准化模型的思想§截取地址关键词§伪地址的处理§统计量的演变第四章北京市地址标准化模型的建立§截取地址关键词§处理二级伪地址

7、§建立北京市地址标准化模型第五章问题讨论隱§北京市地址标准化模型§程序参考文献第一章绪论第一章绪论§研究背景当今时代的一大趋势就是信息化,伴随着信息化时代的来临,出现了数字城市的概念。数字城市(是以计算机技术、多媒体技术和大规模存储技术为基础,以宽带网络为纽带,运动遥感、全球定位系统、地理信息系统、遥测、仿真虚拟等技术,对城市进行多分辨率、多尺度、多时空和多种类的三维描述,即利用信息技术手段把城市的过去、现状和未来的全部内容在网络上进行数字化虚拟实现。在数字城市的信息资源融合的过程中,需要将非空间信息转化成空间信息。地理编码是这一转化的

8、一项关键技术。地理编码(是基于空间定位技术的一种编码方法,它提供了一种把描述成地址的地理位置信息转化成可以被用于系统的地理坐标的方式。通过对现有的信息系统的数据资源进行分析可以发现:非空间数据资源都有具体的

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。