deep+web查询接口及查询结果抽取研究

deep+web查询接口及查询结果抽取研究

ID:33169268

大小:5.44 MB

页数:142页

时间:2019-02-21

deep+web查询接口及查询结果抽取研究_第1页
deep+web查询接口及查询结果抽取研究_第2页
deep+web查询接口及查询结果抽取研究_第3页
deep+web查询接口及查询结果抽取研究_第4页
deep+web查询接口及查询结果抽取研究_第5页
资源描述:

《deep+web查询接口及查询结果抽取研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、中论由学答南开大学学位论文使用授权书根据《南开大学关于研究生学位论文收藏和利用管理办法》,我校的博士、硕士学位获得者均须向南开大学提交本人的学位论文纸质本及相应电子版。本人完全了解南开大学有关研究生学位论文收藏和利用的管理规定。南开大学拥有在《著作权法》规定范围内的学位论文使用权,即:(1)学位获得者必须按规定提交学位论文(包括纸质印刷本及电子版),学校可以采用影印、缩印或其他复制手段保存研究生学位论文,并编入《南开大学博硕士学位论文全文数据库》;(2)为教学和科研目的,学校可以将公开的学位论文作为

2、资料在图jf5馆等场所提供校内师生阅读,在校园网上提供论文目录检索、文摘以及论文全文浏览、下载等免费信息服务;(3)根据教育部有关规定,南开大学向教育部指定单位提交公开的学位论文;(4)学位论文作者授权学校向中国科技信息研究所和中国学术期刊(光盘)电子出版社提交规定范围的学位论文及其电子版并收入相应学位论文数据库,通过其相关网站对外进行信息服务。同时本人保留在其他媒体发表论文的权利。非公开学位论文,保密期限内不向外提交和提供服务,解密后提交和服务同公开论文。论文电子版提交至校图}5馆网站:http:

3、#202.113.20.161:8001/index.htm。本人承诺:本人的学位论文是在南开大学学习期间创作完成的作品,并已通过论文答辩;提交的学位论文电子版与纸质本论文的内容一致,如因不同造成不良后果由本人自负。本人同意遵守上述规定。本授权书签署一式两份,由研究生院和图}S馆留存。作者暨授权人签字:篮萱邀2010年5月25日南开大学研究生学位论文作者信息论文题目DeepWeb查询接口及查询结果抽取研究姓名张慧斌学号1120070132答辩日期2010年5月24日论文类别博士■学历硕士口硕+专业学

4、位口高校教师口同等学力硕士口院/系/所信息技术科学学院专业计算机应用技术联系电话13466386878Emailzhanghuibin@126.com通信地址(邮编):天津市南开人学西区公寓:‘8A一7—103(300091)备注:是否批准为非公开论文否注:本授权书适用我校授予的所有博士、硕士的学位论文。由作者填写(一式两份)签字后交校图书馆,非公开学位论文须附《南开大学研究生申请非公开学位论文审批表》。南开大学学位论文原创性声明㈣㈣㈣删舢Y184§{甘:;;;I本人郑重声明:所呈交的学位论文,是本

5、人在导师指导下进行研究工作所取得的研究成果。除文中已经注明引用的内容外,本学位论文的研究成果不包含任何他人创作的、己公开发表或者没有公开发表的作品的内容。对本论文所涉及的研究工作做出贡献的其他个人和集体,均己在文中以明确方式标明。本学位论文原创性声明的法律责任由本人承担。学位论文作者签名:韭慧速2010年5月25日非公开学位论文标注说明根据南开大学有关规定,非公丌学位论文须经指导教师同意、作者本人申请和相关部门批准方能标注。未经批准的均为公开学位论文,公开学位论文本说明为空白。论文题目申请密级口限制

6、(≤2年)口秘密(≤10年)口机密(≤20年)保密期限20年月日至20年月日审批表编号批准日期20年月日限制★2年(最长2年,可少于2年)秘密★10年(最长5年,可少于5年)机密★20年(最长10年,可少于10年)摘要随着互联网的迅速发展,Web中出现了大量可访问的在线数据库,其中蕴含着丰富的信息,称为DeepWeb信息。由于包含这些信息的页面是DeepWeb网站根据用户在查询接口上提交查询动态生成的,因此传统搜索引擎无法索引这些页面。为了使用户能高效快捷的访问DeepWeb信息,DeepW曲数据集

7、成成为目前信息检索领域一个亟待解决的问题,是目前研究的热点。DeepWeb查询接口的理解是DeepW

8、eb数据集成中的一个关键问题,本文在深入分析DeepW曲数据集成研究现状的基础上,对DeepW曲查询接口相关的若干关键技术进行了深入的研究,包括DeepWeb查询接121领域模型的提出,DeepWeb查询接口的发现、模式抽取和基于查询实例的查询结果抽取与标注等内容。具体的创新和贡献如下:●提出了DeepWeb查询接口领域模型DomainModel。在对DeepW曲查询接口研究的基础上,提出了领域模型

9、,它包含了同一领域中所有查询接口的模式信息。从理论上分析了领域模型构建的可行性,并给出了构建方法和存储方案。分析了领域模型在DeepWeb数据集成框架中的作用,基于领域模型为DeepWeb数据集成中的若干问题提出了新的解决方法,为突破集成框架的整体性能瓶颈提供了可能。●提出了一种DeepW曲查询接口发现方法PostClassifier。该方法通过对接口进行查询提交,根据返回结果页面特征判定接口类型,属于Post.Query方法。PostClassifier首先借助Pr

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。