电子元器件标准化信息专业搜索引擎应用分析

电子元器件标准化信息专业搜索引擎应用分析

ID:32048129

大小:2.44 MB

页数:99页

时间:2019-01-31

电子元器件标准化信息专业搜索引擎应用分析_第1页
电子元器件标准化信息专业搜索引擎应用分析_第2页
电子元器件标准化信息专业搜索引擎应用分析_第3页
电子元器件标准化信息专业搜索引擎应用分析_第4页
电子元器件标准化信息专业搜索引擎应用分析_第5页
资源描述:

《电子元器件标准化信息专业搜索引擎应用分析》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、第一章绪论1.1研究背景本课题来源于信息产业部电子工业标准化研究所课题。信息产业部电子工业标准化研究所作为国内权威的电子标准化机构,需要在工作中跟踪研究国内外电子元器件标准化相关信息。传统的工作模式已难以适应当前快速、准确地获取专业信息并迅速做出分析研究和相关标准化活动的需求。根据信息产业部“十一五”工作计划的总体发展,迫切要求标准化专业人员掌握信息化工作方法。先进科技信息资源搜索引擎系统的建立与应用,可以为更好地树立和保持我国电子元器件行业标准的先进性、实效性等提供基础服务。搜索引擎以一定的策

2、略在因特网(Internet)中搜集、发现信息,对信息进行理解、提取、组织和处理,并为用户提供检索服务,从而起到信息导航的目的。从用户的角度来看,它就是一个帮助人们进行信息检索的工具。搜索引擎提供的导航服务已经成为因特网上非常重要的网络服务,搜索引擎站点也被美誉为“网络门户”,搜索引擎技术因而成为计算机工业界和学术界争相研究、开发的对象。目前,搜索引擎已成为一个新的研究、开发领域,涉及信息检索、人工智能、计算机网络、分布式处理、数据库、数据挖掘、数字图书馆、自然语言处理等多领域的理论和技术,具有

3、综合性和挑战性。同时,由于搜索引擎的实用性,给大量的用户带来很好的经济价值,所以引起了世界各国计算机科学界和信息产业界的高度关注,目前的研究、开发十分活跃,并出现了很多值得注意的动向。通用搜索引擎一般存在网页覆盖率低、索引不及时和返回结果不精确等缺点,难以快速、准确地获取所需要的专业信息,无法满足人们对于特定知识的检索要求。在此情况下,多元化的搜索引擎开始应运而生了,专业性和专题性的搜索引擎层出不穷并成为发展趋势,搜索引擎更趋人性化和智能化。专业搜索引擎也称主题搜索引擎、专用搜索引擎、垂直搜索引

4、擎等,是搜索引擎发展的一个旱程碑。专业搜索引擎通过对专业领域信息的完全收录与及2电了元器件标准化信息专业搜索引晕应用研究时更新,避免了搜索时无用信息的干扰,提高了查询效率,在提供专业信息方面有着其它检索工具无法比拟的优势,因此受到越来越多的用户的欢迎。据赛迪网的“国内搜索引擎市场调查报告”显示,92%的网民认为将来垂直型的专业搜索引擎非常可能或可能使用。目前,专业搜索引擎的研究J下在成为一个热点,并形成了一些代表型的系统。如国外Inktomi的about.com涵盖700多个主题领域,NEC研究

5、院的CiteSeer系统提供科学论文检索,BiologySearchEngines生物引擎等;在国内,中国搜索推出了行业搜索,各大型商业搜索引擎如百度等也推出了mp3、图片、电影等特定主题的检索,根据相关文献,国内还研制了“生物”、“林业”、“煤炭”等专业搜索引擎。根据资料,当前国内外还没有发现电子元器件标准化信息方面的专业搜索引擎。本课题希望能在电子元器件标准化专题信息检索方面抛砖引玉,促进标准化信息服务技术的研究工作。1.2论文主要研究内容本课题通过建立面向电子元器件标准化信息的专业标准化搜

6、索引擎,可以自动将网上的电子元器件标准化信息采集分析后存入本地信息库,并分类存储,按关键词查询,使专业人员能够快速而准确地获得关心的信息。该系统定期采集的信息可以作为情报处理的信息源,免除人力逐个查找下载的过程,更为将来实现信息自动处理提供基础。本项目通过对国内外专业搜索引擎技术及其特点研究,在对电子元器件标准化信息资源的分布分析的基础上,综合运用搜索引擎技术和人工智能技术,建立定向的搜索引擎,以及页面和内容分析工具,并存储于便于搜索的中心知识库中。本课题的主要研究内容包括:(1)专业搜索引擎技

7、术研究分析(2)元器件标准化信息分布及其特点分析(3)元器件标准化信息搜索引擎原型的实现以上研究工作主要技术难点在于元器件标准化信息库的设计与建立,既包括关键词和相关词的确定以及词库的描述、建立、应用等,又包括信息搜索引第一帝绪论3擎系统关于信息采集、搜索、分类及存储整个过程匹配度分析和算法的确定。研究方案采用以下技术架构:图卜l技术架构整个系统设置一个中心库,保存所有相关数据。系统的数据流程如下:由网络蜘蛛按照设置好的搜索策略在网上搜索专业信息,然后由页面分析器进行信息分类和评估,分析通过的信

8、息保存到具有查询功能的中心库中,并通过查询和管理系统对用户服务。1.3论文的组织结构本文包括以下几个部分:第一章:绪论,介绍项目的背景、主要研究内容,以及论文的章节结构等;第二章:搜索引擎技术发展概述,主要介绍搜索引擎的主要发展历史、分类、研究现状和发展趋势、专业搜索引擎产生的背景和意义,分析专业搜索引擎的特点,以及专业搜索引擎的研究状况;第三章:搜索引擎关键技术分析,分析通用搜索引擎的架构和工作原理,通用搜索引擎的关键技术,包括网络蜘蛛、页面提取器、页面分析器、链接分析器、爬行选择器、索引器和

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。