通讯地址查询邮政编码系统设计

通讯地址查询邮政编码系统设计

ID:20180079

大小:59.00 KB

页数:8页

时间:2018-10-09

通讯地址查询邮政编码系统设计_第1页
通讯地址查询邮政编码系统设计_第2页
通讯地址查询邮政编码系统设计_第3页
通讯地址查询邮政编码系统设计_第4页
通讯地址查询邮政编码系统设计_第5页
资源描述:

《通讯地址查询邮政编码系统设计》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、通讯地址查询邮政编码系统设计随着电子商务的突飞猛进和物流行业的信息化,使得人们在足不出户的情况下完成购物和邮寄物品,大大节约了时间和金钱成本。电子商务和物流行业都离不开通信地址(又称为通讯地址,简称为地址)和邮编,本文关注怎样识别一个地址,并找到该地址对应的邮政编码。1现状分析随着电子商务的突飞猛进和物流行业的信息化,使得人们在足不出户的情况下完成购物和邮寄物品,大大节约了时间和金钱成本。电子商务和物流行业都离不开通信地址(又称为通讯地址,简称为地址)和邮编,这些数据都需要用户提供,当前一些电子商务X站和物流行业的主要的做法如下:(

2、1)让用户手工输入完整的地址和地址对应的邮编。(2)通过下拉列表提供省,省下面地级市和地级市下面的区县,这些比较固定的地址让用户选择,余下的地址和邮编由用户手工输入。(3)保留用户输入的地址和邮编,方便下次再次使用,即如果本次输入的地址和邮编之前已经有了一份,直接选中,就避免了让用户重复输入。这些做法主要存在的问题如下:(1)很多情况下用户未必知道自己输入的地址对应的邮编。(2)由于基于拼音的输入法和汉语本身存在的缺陷(汉字存在多音字,多个汉字拥有相同的读音,多数基于拼音的输入法都是基于统计的语言模型),再加上地址中存在的一些生僻字

3、的原因会导致输入的地址存在错别字。(3)由于地名存在别名现象,即同一个地名有多种叫法,例如“广东省”的别名有“广东”和“粤”,因此他们识别不了对同一个地名的不同描述。(4)有些情况下用户无法输入完整的地址,当输入的时候一脸茫然和无助。(5)由于地址存在变更和搜集不完全的问题,这些X站的数据往往得不到更新。当前一些其他的X站能够解决第一个问题,即帮助用户得到地址对应的邮编。但是他们往往采用数据库技术来实现的系统,对于低于区县级别的地址,往往采用字串模糊查询(like%XXX%)的方式参与检索,由于性能的原因此种方式对于大数据量的查询效

4、率很差。另外基于数据库实现的查询使得用户的输入格式和内容受到了很大的限制,比如:用户首先选择省级行政区(包括省、特别行政区、自治区和直辖市)的名字,其次是选择地级行政区(包括地级市、自治州、地区和盟)级别的名字,然后再县级行政区(包括市辖区、县、旗、特区、林区、自治县和自治旗等)级别的名字,最后用户输入乡镇级别及村庄道路等。查询的输入过程非常机械。另外基于数据库的查询模式,要求地址格式全部满足四级,即省级,地级市级,区县级,然后是其他具体地址。但是并不是所有的地址都满足此种情况,例如直辖市下和省与直辖县或省直辖县级市之间就没有地级市

5、级,一些特殊的地级市没有区县级,如广东省中山市、广东省东莞市、海南省三亚市、海南省三沙市、甘肃省嘉峪关市;他们的解决办法,起个其他的名字代替,例如“直辖区县”,“市辖区”,“省直辖县”等,但是查询的结果中一般也包含这些非真正地址的数据。本方法尝试解决如下问题:(1)帮助用户输入,即提供输入提示功能(类似GoogleSuggestion)。(2)采用基于搜索引擎技术使得用户输入的查询格式更加自由,并且通过一个比较短的地址片段就可以找到完整的地址。(3)基于命名实体识别技术能够识别出用户输入地址元数据的级别,从而实现地址的逐级查询(例如

6、已知一个地级市,给出该地级市下所有县级行政区的名字和对应的邮编;已知一个省的名字,给出该省下所有地级行政区的名字和对应的邮编等)。(4)自动从互联X上抓取地址数据,完成参考数据的更新。(5)对不用的参考数据进行校验,识别出有问题的参考数据,使得参考数据更加准确。(6)有时候由于参考数据在乡镇级行政区级别及以下级别上收录得不是很全,本方法可以通过地址补全方式完善查询结果。(7)实现查询结果地址的切分和级别标注,方便用户灵活使用结果。(8)将地址和对应的邮编加密到二维码中,方便用户通过二维码扫描软件直接获取完整的地址和邮编。(9)将用户

7、的检索结果链接到知名的地图厂商(百度,谷歌,搜狗地图等)获取相关地址的经纬度数据。2系统设计2.1总体架构设计本系统的总体架构如图1所示。从图1邮编查询系统的总体架构图可以看出,该系统需要三种数据:(1)用于通过通信地址查询邮政编码的通信地址和邮政编码对应关系的数据。(2)用于输入地址提示的标准化的通信地址数据。(3)用于地址切分,地址标注,命名实体识别和Query语句生成的地址元数据字典数据。第一种数据:通信地址和邮政编码的对应关系,可以从一些数据比较新而且数据比较标准和完整的邮编查询X站上,利用基于种子的X络爬虫和信息抽取技术抓

8、取相关数据。第二种数据:标准化的通信地址数据,一种是第一种数据去掉邮政编码后的通信地址数据,第二种,从维基百科和国家统计局X站上,最新的有关中国行政区划上的X页上利用爬虫技术和信息抽取技术抽取得来。第三种数据:地址元数据字典数据,源自

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。