数据库技术应用问题研究.pdf

数据库技术应用问题研究.pdf

ID:58306285

大小:113.65 KB

页数:1页

时间:2020-05-20

数据库技术应用问题研究.pdf_第1页
资源描述:

《数据库技术应用问题研究.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、◇科技之窗◇科技曩向导2015年15期数据库技术应用问题研究滕健鲲孙桂琴(莱芜市科技信息研究所山东莱芜271loo)【摘要】本文介绍了大数据概念,分析了关系数据库在存储大数据量方面的不足,并介绍了当前NOSQL数据库的基本理论和当前产品分类。大数据时代的来临,我们忙于如何存储和处理这些数据,但随着计算机互联网、移动互联网、物联网等网络的快速发展,数据量会持续大幅增长.如何长期保存这些数据以及如何处理更大级别的数据量,都需要我们思考并解决。【关键词】大数据;关系数据库;NOSQL1.NOSQL数据库数据库分为KeyVMue,Key-Docnment和Key-Colu

2、mn这3类。典型的1.1NOSQL数据库理论基础NOSQL产品有GooSe的BigTable、基于HadoopHDFS的HBase、NOSQL作为新兴数据库系统概念.由于其具备处理海量数据的Amaz0n的Dynam0、CouchDB、MongoDB、Redis等。NOSQL数据库遵循能力.近年来受到各大rI’公司的追捧。Amazon、GooSe等大型网商已CAP理论和BASE原则.大部分Kev—vaIue数据库系统都会根据自己纷纷斥资进行研究并开发了适用的产品。谈及NOSQL数据库,首先应的设计目的进行相应的选择,如Cassandra、Dvnamo满足AP,该了解

3、支持NOSQL的理论:CAP理论、BASE思想和最终一致性。BigTable、MongoDB满足cP。1.1.1CAP理论2.大数据CAP理论由EricBrewer在ACMPODC会议上的主题报告中提美国国家标准和技术研究院对大数据做出了定义:“大数据是指出.这个理论是NOSQL数据管理系统构建的基础.CAP解释为一致性其数据量、采集速度,或数据表示限制了使用传统关系型方法进行有Consistency)、可用性(Availability)以及分区容忍性(PartitionTolerance)。效分析的能力.或需要使用重要的水平缩放技术来实现高效处理的数具体描述如下

4、:据”我们认为大数据价值链可分为:数据生成、数据采集、数据储存以强一致性(consistencv):系统在执行过某项操作后仍然处于一致及数据分析。数据分析是大数据价值链的最后也是最重要的阶段,是的状态在分布式数据库系统中.数据变更后所有的用户都应该读取大数据价值的实现.是大数据应用的基础.其目的在于提取有用的值.到最新的值.这样的系统被认为具有强一致性。提供论断建议或支持决策.通过对不同领域数据集的分析可能会产生可用性(Availability):每一个操作都能够在一定的时间内返回结不同级别的潜在价值果“一定时间内”是指系统的结果必须在给定时间内返回。如果超时目前

5、根据数据的生成方式和结构特点不同.可以将数据分析划分则被认为不可用.“返回结果”同样非常重要.必须能提供成功或失败为6个关键技术领域:(1)结构化数据。一直是传统数据分析的重要研的信息。究对象,目前主流的结构化数据管理工具.如关系型数据库等,都提供分区容错性(PartitionTolerance):分区容错性可以理解为系统在了数据分析功能。(2)文本。是常用的存储文字、传递信息的方式,也是存在网络分区的情况下仍然可以接受请求CAP是在分布式环境中设最常见的非结构化数据一直演化到2l世纪初新兴的在线社交网络计和部署系统时所要考虑的三个重要的系统需求根据CAP理论.数

6、分析(3)WEB数据。WEB技术的发展.极大地丰富了获取和交换数据共享系统只能满足这三个特性中的两个.不能同时满足三个条件据的方式,WEB数据高速的增长,使其成为大数据的主要来源。(4)多因此系统设计者必须在这三个特性之间做出权衡。例如Amazon的媒体数据。随着通讯技术的发展,图片、音频、视频等体积较大的数据,Dynamo具有高可用性和分区容错性但不支持强一致性.也就是说用也可以被快速地传播.由于缺少文字信息.其分析方法与其他数据相户不能立即看到其他用户更新的内容比.具有显著的特点。(5)社交网络数据。从一定程度上反映了人类社1.1.2BASE思想会活动的特征.

7、具有重要的价值。(6)移动数据。与传统的互联网数据BASE(BasicallyAvMlable).基本可用。强调数据库的最终一致不同.具有明显的地理位置信息、用户个体特征等其他信息。(Eventuallyconsistent最终一致.最终数据一致就可以,而不是时时高大数据未来的应用领域和方向还包括以下几个方面:(1)大数据一致).不同于传统关系数据库基于的ACID模型ACID特性与高性可视化。在许多人机交互场景中.都遵循所见即所得的原则.例如文能是不兼容的。比如.在网店买东西.每个客户买东西时都会通过锁来本和图像编辑器等在大数据应用中.混杂的数据本身是难以辅助同步

8、数据操作.

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。