聚集查询开发

聚集查询开发

ID:35714735

大小:2.68 MB

页数:38页

时间:2019-04-13

聚集查询开发_第1页
聚集查询开发_第2页
聚集查询开发_第3页
聚集查询开发_第4页
聚集查询开发_第5页
资源描述:

《聚集查询开发》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、摘要近几年来,随着计算机和信息技术的迅猛发展和普及应用,行业应用系统的规模迅速扩大,行业应用所产生的数据呈爆炸性增长。动辄达到数百TB甚至数十至数百PB规模的行业或企业大数据已远远超出了现有传统的计算技术和信息系统的处理能力。因此,寻求有效的大数据处理技术、方法和手段已经成为现实世界的迫切需求。百度目前的总数据量已超过1000PB,每天需要处理的网页数据达到10PB~100PB;淘宝累计的交易数据量高达100PB;Twitter每天发布超过2亿条消息,新浪微博每天发帖量达到8000万条;中国移动一个省的电话通联记录数据每月可达0.5PB~1PB;一个省会城市

2、公安局道路车辆监控数据三年可达200亿条、总量120TB。据世界权威IT信息咨询分析公司IDC研究报告预测:全世界数据量未来10年将从2009年的0.8ZB增长到2020年的35ZB(1ZB=1000EB=1000000PB),10年将增长44倍,年均增长40%。由于数据量的快速增长,对大数据的操作和结构化查询在日常的数据处理经常用到,聚集查询也是查询时使用比较多的查询。关键词:聚集查询;结构化查询IVABSTRACTIn recent years, with the rapid developmentof computerand informationte

3、chnology,, industry application system has expanded , andthedatageneratedbytheapplciationsgrowsfast. Thedatawhichalways reaches hundreds of TB or tens to hundreds of PBhas been far beyond the existing traditional  processing capacity of information system. Therefore, to seek effect

4、ive data processing technology, method and means isingreatneedin the real world.Baidu now ownsdataexceeded100PB,andithasto deal with data withvolumeof 10 PB ~ 100 PB; thetransactiondataofTaobaoreaches 100 PB; Twitter releases more than 200 million messages a day;  Sina Weibo posts 

5、 80 millionmessageaday; datageneratedofone province of China Mobile Communications telephoneis up to  0.5PB ~ 1PBamonth; a capital city theroad vehicle monitoring data ofacapitalcityinthreeyearsis up to 120TB. According to the world authority IT information consulting research firm

6、 IDC analysis report,   the amount of data generatedbythewholeworldin the next 10 years will increase from 0.8ZBin2009to 35ZB 35 in 2020(1ZB = 1000EB = 1000000PB).Thedatavolume grows 44 timesintenyears, with an average annual growth of 40%. Dueto the rapid growth in data volume,  t

7、he operation of the large data structured query is often used in the daily data processing, aggregate query is oneofthequeriesusedmostlyinbigdataprocessing.Keywords:AggregateQuery;StructuredQueryIV1绪论11.1本文研究的背景和意义11.2国内外研究现状与热点41.2.1大数据研究文献的国别和机构分布41.2.2大数据研究的学科领域分布51.2.3大数据产业技术创新

8、的重点方向51.3论文主要研究内容61.3.1hdf

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。