欢迎来到天天文库
浏览记录
ID:58988708
大小:1.61 MB
页数:10页
时间:2020-09-27
《非结构化数据知识ppt课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、关于大数据时代的新技术—之非结构数据转换技术2013年2月19日结构化数据:行数据,存储在数据库里,可以用二维表结构来逻辑表达实现的数据。非结构化数据:不方便用数据库二维逻辑表来表现的数据,包括所有格式的办公文档、文本、图片、XML、HTML、各类报表、图像和音频/视频信息等。非结构化数据库:其字段长度可变,并且每个字段的记录又可以由可重复或不可重复的子字段构成的数据库,用它不仅可以处理结构化数据(如数字、符号等信息)而且更适合处理非结构化数据(全文文本、图象、声音、影视、超媒体等信息)。几个概念随着网络技术的发展,特别是Internet和Intran
2、et技术的飞快发展,使得非结构化数据的数量日趋增大。这时,主要用于管理结构化数据的关系数据库的局限性暴露地越来越明显。因而,数据库技术相应地进入了“后关系数据库时代”,发展进入基于网络应用的非结构化数据库时代。数据库技术变迁据一项调查报告中指出:企业中80%的数据都是非结构化数据,这些数据每年都按指数增长60%。如今,这种迅猛增长的从不使用的数据在企业里消耗着复杂而昂贵的一级存储的存储容量。如何更好的保留那些在全球范围内具有潜在价值的不同类型的文件,而不是因为处理它们却干扰日常的工作?当然你可以采购更多的就地存储设备,但这总会有局限性的。云存储是越来越
3、多的IT公司正在使用的存储技术。非结构化数据的存储技术—云计算(1)云存储的好处:企业能大幅减少存储基础架构成本,在减少人工管理非结构化数据所需时间的同时增加了存储的灵活性;定价都是根据实际使用了多少存储容量而决定的。支付多少钱就享用多少容量。因此不再需要存储架构师,也不再需要安装和管理存储设备;保障不出现有害的物理访问,还保护任何自然和人为操作所产生的灾难;随着备份和灾难恢复的处理和要求变得日益复杂、昂贵以及耗费时间,云存储能够大大减少这种复杂性和成本。非结构化数据的存储技术—云计算(2)1、计算机的存储结构决定了其处理结构化数据具有很大优势,例如关
4、系数据库已发展得非常成熟,将大量的非结构化数据进行转换就能利用计算机处理结构化数据的优势及数据库成熟技术;2、若非结构化数据无法自动转换,就需要通过扫描、识别、录入等许多人工处理工序,费时费力而且成本高昂。如果能够自动化地直接转换,则可以直接输入到企业内容管理系统中,并有效提取价值信息和索引,企业的工作效率将会大为提高,而成本也会相应降低。非结构化数据的转换技术—意义非结构化数据的转换技术—主要产品非结构化数据的转换技术—主要产品非结构化数据的转换技术—主要产品非结构化数据的转换技术—主要产品
此文档下载收益归作者所有