农业气象信息的网络获取方法研究.pdf

农业气象信息的网络获取方法研究.pdf

ID:52202896

大小:661.75 KB

页数:3页

时间:2020-03-24

农业气象信息的网络获取方法研究.pdf_第1页
农业气象信息的网络获取方法研究.pdf_第2页
农业气象信息的网络获取方法研究.pdf_第3页
资源描述:

《农业气象信息的网络获取方法研究.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第3期总第225期农业科技与装备No.3TotalNo.225至Q!兰±兰旦垒瘦!坐坐丛兰!!!里£曼壁!兰!丛旦!竺敛塑垒里唑P翌竺坐丛苎:尘Q!兰农业气象信息的网络获取方法研究李馨(黑龙江省农业机械工程科学研究院,哈尔滨150081)摘要:针对农业科研和农业生产对气象信息的需求,在分析目前气象信息获取方法的基础上,给出一种通过互联网途径自动搜集和抓取气象信息(包括气象预报信息和天气实况信息)的方法,并给_}f5用Perl语言书写的关键代码。实际应用证明,该法能够满足科研人员对气象信息的实新性和便捷性需求。关键词:气象信息;自动抓取;Peal语言;网络

2、中图分类号:S165+.25文献标识码:A文章编号:1674-1161(2013)03-0027-03从互联网上得到的气象信息通常分为天气预报和天气实况两种。这些信息在农业科研和农业生产中至关重要。是开展研究和指导生产的重要依据。在互联网高速发展的今天。人们可以通过各种途径访问提供气象服务功能的网站。并及时获取相关信息。毫无疑问。这对于仅仅需要了解短期天气预报信息的公众来说是符合需求的.但很难满足科研工作和生产系统的要求。绝大多数科研人员需要从相关气象台站有偿获取相关数据,且无法保证数据的实时性。现介绍一种通过互联网自动搜集和抓取气象信息的方法,并给出了

3、用Perl语言书写的关键代码.以满足科研人员对气象信息的实新性和便捷性需求。1气象信息数据源分析按照我国气象法的规定,气象信息只能由达到一定级别的气象部门发布。因此,权威性气象信息只能来源于国家各级气象台站或者经过授权的机构网站。使用百度互联网搜索引擎以“气象信息网”、“天气预报”和“天气实况”为关键词进行查询。对查询结果进行分析整理,得到如下独立提供实时气象信息的国内权威网站:www.weather.com.cn(中国天气网),WWW.nmc.gov.cn(中央气象台),www.t70nline.com(天气在线)。其中,中国天气网由中国气象局公共气象

4、Ii

5、l乏务中心主办。集成了中国气象局下属各业务部门的业务服务产品。天气实况信息每隔lh整点更新.能够满足需求。因此,确定采用“中国天气网”为数据源,亨l:展相关数据自动获取方法研究。通过分析中国天气网天气预报页面,确定天zi顶报信息在页面中以表格形式存在,天气实况信息以收稿日期:2012—12—25作者简介:李馨(1970一),女,高级工程师,从事农业机械设计方面的工作。Flash控件方式展示。对该页面结构和源文件内容进行分析可知,气象信息的URL基本地址为:http://www.weather.corn.cn/weathed;天气实况信息的URL基础

6、地址为:http://flash.weather.com.cn/sk2/。各个城市的天气预报和天气实况信息对应的文件分别为:城市编码.shtml和城市编码".xInl。例如。哈尔滨市区的天气预报页面文件为101050101.shtml。天气实况数据文件为101050101.xml。2气象信息的提取网页发竹i的气象信息是以非结构化形式存在的,而科研和生I七中需要的气象信息(如温度、风向、风力、降水、丰

7、

8、对湿度等)则要求是结构化的。因此必须从网页文件中剥离用于说明文档的标记信息。并分解抽取非结构化的气象信息数据.然后存储到数据库中.以实现结构化。2.1天气

9、预报信息的提取网页文档中的信息(元素)是按照树状结构组织的.因此必须确定要查找信息的层次位置和信息特征以哈尔市区天气预报页面为例,采用opera浏览器检查页面组成元素。可得到发布天气预报信息的元素组织结构(如图1所示)。由图1分析可知。天气预报信息的发布分为两个部分.即3日内天气预报信息和未来4—7d预报信息两种;采用两个分栏发布,以表的形式展示。3Et内天气预报信息的特征标志为。未来4~7日天气预报信息的特征标志为

10、ba02”>。传统做法是采用正则表达式匹配该特征标志,然后再匹配各项天气预报信息前的标签.从而抽取出想要的内容。鉴于绝大多数的气象信息需求者不具备较高的编程能力。故采用对文本具有较强处理能力的农业科技与装备2013年3月嗣divdass..。veatherYubao。id-’7d。'嗣曲lclass.’Ⅵeathe吡。'疃身嚷天气醒f2012髑.趋18:咧娜)出‘,hl>嗣划ivclas乒‘veatherYubao即I’)

11、lpadding.‘0。><0·由,i--’田譬哆。cl静’yuBaoTable

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。