web服务搜索引擎的设计与实现

web服务搜索引擎的设计与实现

ID:34564943

大小:3.61 MB

页数:4页

时间:2019-03-08

web服务搜索引擎的设计与实现_第1页
web服务搜索引擎的设计与实现_第2页
web服务搜索引擎的设计与实现_第3页
web服务搜索引擎的设计与实现_第4页
资源描述:

《web服务搜索引擎的设计与实现》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第28卷第1期计算机应用与软件Vol28No.12011年1月ComputerApplicationsandSoftwareJan.2011Web服务搜索引擎的设计与实现贺财平覃事刚刘建勋(湖南科技大学知识处理与网络化制造湖南省普通高校重点实验室湖南湘潭411201)摘要随着开放的Web服务数量的逐渐递增,全面而有效地获取散落于Internet上的这类Web服务并进行管理就成为一个十分重要的问题。针对该问题,设计与实现了一个Web服务搜索引擎WSSE(WebServicesSearchEngine)。它不断爬行现有Web站点以搜

2、索Web服务,并对搜集到的Web服务进行集中式管理,最后采用开源的Lucene对搜索到的Web服务建立索引,提高了Web服务的检索效率。关键词Web服务搜索引擎网络爬虫DESIGNANDIMPLEMENTATIONOFWEBSERVICESSEARCHENGINEHeCaipingQinShigangLiuJianxun(KeyLabofKnowledgeProcessingandNetworkedManufacture,HunanUniversityofScienceandTechnology,Xiangtan411201,Hunan,C

3、hina)AbstractWiththegraduallyincreasingnumberofopenWebservices,itiscrucialtoobtaininfullandeffectivelysuchopenWebservicesscatteredontheinternetaswellasmanagethem.Inthispaper,wedesignedandimplementedaWSSE(WebServicesSearchEngine)inordertosolvethisissue.ArobotwasdevelopedinWSSEt

4、ocrawlalongtheexistingWebsitesincessantlyforsearchingtheWebservices,andthefoundWebserviceswouldthenbestoredinacentralizedmanagementsystem.FinallyweusedtheopensourceLucenetoindexthefoundWebservicesforenhancingtheefficiencyofWebservicesretrieva.lKeywordsWebservicesSearchengine

5、WebcrawlerGoogle的Web服务搜索方法,设计与实现了Web服务搜索引擎0引言WSSE(WebServicesSearchEngine),它以Google的搜索结果为数据源展开Web服务搜索,以提高Web服务搜索的效率。并将[1]搜索到的Web服务进行集中管理,最后采用开源的Lucene[3]对Web服务是由URI标识的软件系统,其接口和绑定可以通过XML进行定义、描述和发现。Web服务支持通过基于互联搜索到的Web服务建立索引,提高Web服务的检索效率。网的协议,使用基于XML的消息与Web服务或者其他软件系统进行直接交互。它的出现

6、改变了传统的计算模式,形成了一1背景知识个崭新的分布式计算模型,是Web上数据和信息集成的有效机[4]制,它还具有自包含、自描述、模块化和松耦合等特点。公开、可访问的WSDL文档都是放在Web服务器上的,[2]在Web服务中,UDDI注册中心为服务的发布和发现提因此很有可能被通用搜索引擎的爬虫爬取,并建立索引。我们供了一个公共平台。目前,越来越多的企业采用Web服务进行知道Web页面和WSDL文档在结构上有很大的不同,但是通用企业业务集成,并建立起相应的UDDI注册中心,但是这些UD搜索引擎仅把WSDL文档当成普通的页面,忽视了Web服务的DI注册

7、中心却是私有的,只在企业范围内使用,并不对外发布,属性,例如:绑定信息、端口等。此外,基于Web的通用搜索引我们称该类Web服务为封闭式服务。作为Web服务倡导者的擎只是简单地缓存或者存储WSDL文档,并没有提供任何以业[5]微软和IBM在2006年相继关闭了它们的公有UDDI注册中心,务为中心的模型或者与Web服务保持一致的标准。由于In转为私有。然而由于许多厂商和Web服务编程爱好者提供大ternet上信息的海量性以及信息持续不断的增多,重新设计网络[6-8]量的免费工具来快速生成、部署和解析Web服务,任何企业或爬虫到Internet搜索Web

8、服务是不现实的且浪费时间。因者个人都可以在Internet上生成、部署和发布(使用Inspec

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。