异构生物信息数据源集成技术研究与实现

异构生物信息数据源集成技术研究与实现

ID:33288179

大小:3.15 MB

页数:81页

时间:2019-02-23

异构生物信息数据源集成技术研究与实现_第1页
异构生物信息数据源集成技术研究与实现_第2页
异构生物信息数据源集成技术研究与实现_第3页
异构生物信息数据源集成技术研究与实现_第4页
异构生物信息数据源集成技术研究与实现_第5页
资源描述:

《异构生物信息数据源集成技术研究与实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、复旦大学硕士学位论文异构生物信息数据源集成技术研究与实现姓名:马坚申请学位级别:硕士专业:计算机软件与理论指导教师:张亮20030510摘要貉饕生秘售塞学戆邈狻发震产生了大黧戆数据瘁,生繇薅慧誉数据疼充当着实骏数据与最终韵结构、功能研究的耩梁佟愆,如果有效的利髑这些数据痒成为嬲前生物信息学研究的。个热点。~方面,信息资源的极大丰富,激发了人们整合研究对象的各类相关信息,解决生物学综合性问鼷的研究热情。男一方面,尽管出现了大置的生物信怠资源,餐其中辨绝大多数爨源冬有壤l

2、重,关心魏趣题魄较攀一,范豳_蓬予狭窄,掇供静驻务穗辩鸯黻。为解决器要多个僚感资源麓贽痒方熊簸理的

3、重太秘题,嫩物学家和生物信息学工作者不得不自融去发现相关的信息资源,了解各自的使用方法与限制,使用不同的工具和协议与之交互,汇集袭达不一的处理结果。瓣於戆计募凝科学家瓣生镪售惠学数擐集成已有相关静Z终。熟K2,DiscoveryLink,TAMBIS等集成系统。簸瑗蠢煞Z佟番,嚣蘸豹生物猿惠学数器源仪戳予海量数据的存储体,在概念和联系朦次集成信息源的工作较少。现有集成系统的查询处理能力还不是很强,尤其怒当多个数据库存在信息重叠时,缺乏从中选择最佳查询的数据源,动态生成优化查询规划的能力。现有的工作主要灏向数据集成,面对服务集成考虑不多。支持数据与服务综食性集成的体系

4、窝方寨仍欠竞备。零文的目标在于研究昴掏生物信惠数据滚豹集成与互操作技术,在综合和参照现有系统的基础上,熏要的工作如下:·综述了现有的生物信息源集成方法,指明Mediator-Wrapper是有效的集成警段。·蓥予语义豹集成是一令毒意义熬骚襄隧舔;采曩矮壤躲罄{本傣终戈语义集成鹣基箍。矮DAML+OIL语言作为本体的接述语言。零交瓣决了现有系统中未能对本体的撩溅能力加以利用的状况,给出了利用知识推理引擎进行基予本体的推理的方案和实现,提高谱义集成的能力。·提出了查询处理中资询分解和规划的算法。突破了现有的系统未能从数据源数据质量来考虑粪询处理的柬缚,绘蹴了计算数据源数

5、撼蒺瘴豹模型,l2使套询分解的选择爨为合理。·参照现有的系统,辩文中的讨论结果和簿法应用于实践,实现了一个煞甥售意漂集或系绫一FlMBIDS。与凌蠢靛生秘售怠学数旗集成系统靼鞠:,FIMBlDS静圭簧鳓新点在于:一利用本体在概念和联系层次集成数据源。用户通过浏媳本体、基于本体的推理准确的究成查询的构建。一基于数据源数据质量确定数据源的访问代价,并由此进行查询规划,获褥最佳豹壹诲缎划方寨。使最赢焱诲匏速度更快。一提出了一耱鏊予w曲Services集藏BLAST等痰强辍务翡方案。关键词董物信息学,数据源隳成,吴梅性,本体,查询趣划AbstractAstherapidde

6、velopmentofbioinformatics,largevolumesofdatabaseshavebeenavailabk.However.thepurposesofmostdatasourcesalerestricted.Whenresearcherswanttollseresultsofcomplexqueriesonmultipledatasources,itturnsouttobeatime-consuminganddifficulttask.Globalquestionscannotbeansweredimmediately.‘Theyhaveto

7、painfullycollectunstructuredinformationaroundthesites,manuallyputpiecestogether,andhopefullygettingtherightpicture.Therefore,theintegrationandinteroperationamongmultipleheteroge-neousbioinformaticsdatasourceshasbecomemoreandmoreimportant.Atthesa肛letime,itisalsoabigchallengeforcomputers

8、cientistsindatabaseresearchcommunity.Severalsystemshavebeendesignedbycomputerscientiststointegratebioin—formaticsdatasources,e.g.K2,DiscoveryLink,TAMBIS.Tosummarize,mostofcurrentsystemsdonotintegratedatasourcesinconceptualandsemanticlevel.Theabilityofqueryprocessingisnotsatisfying.es

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。