谷歌(google)云计算基于大规模集群的海量数据处理技术

谷歌(google)云计算基于大规模集群的海量数据处理技术

ID:15059326

大小:175.50 KB

页数:5页

时间:2018-08-01

谷歌(google)云计算基于大规模集群的海量数据处理技术_第1页
谷歌(google)云计算基于大规模集群的海量数据处理技术_第2页
谷歌(google)云计算基于大规模集群的海量数据处理技术_第3页
谷歌(google)云计算基于大规模集群的海量数据处理技术_第4页
谷歌(google)云计算基于大规模集群的海量数据处理技术_第5页
资源描述:

《谷歌(google)云计算基于大规模集群的海量数据处理技术》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、谷歌(Google)云计算“基于大规模集群的海量数据处理技术”师资培训研讨班邀请函尊敬的各位老师:您好!谷歌是世界上最大的云计算的实践者。随着云计算时代的到来,产业对于人才提出了新的要求,相应的计算机课程面临着内容更新的需要。谷歌在2007年就提出了云计算学术合作计划,通过与大学的合作,开发培养下一代符合产业需求新型人才的云计算课程。为了支持高校进行云计算时代的课程建设和人才培养,谷歌公司将从11月30日至12月5日协同清华大学,举办云计算“基于大规模集群的海量数据处理技术”课程。本课程设置包括三个部分:课程讲学、上机实验,以及课程结束之际的学生课程开发项目,

2、其目的是教学和实践相结合,学以致用,培养学生创新和动手能力。本课程结合谷歌MapReduce数据处理技术,并作为谷歌支持中国高校云计算计划和课程建设项目的一部分。师资培训研讨班的信息,请参考如下:时间:2009年11月30日~12月5日,共6天;每天上午9:00-下午5:00地点:清华大学(具体地点在培训确认函中给出)邀请对象:高校计算机专业和软件工程专业,从事相关课程的授课教师培训内容:本培训将基于谷歌(Google)公司与清华大学合作开设的有关集群分布式编程的课程。通过本课程的学习,学员将深入了解到通过大规模集群的模式处理海量数据的方式与编程方法。通过实践

3、相关的课程内容,使用开源的ApacheLuceneHadoop工具,学员将亲身实践Google文件系统以及Google所使用的分布式编程方式MapReduce。学员还需要完成特定的分布式应用程序设计来巩固所学的编程知识,用于处理实际的海量数据问题。课程详细内容请参考附件。预备知识:1)阅读GoogleMapReduce技术论文:http://labs.google.com/papers/mapreduce-osdi04.pdf2)Multithreadedprogramming3)Javaprogramming,4)Eclipseenvironment,awo

4、rkingknowledgeofLinux培训讲师:清华大学陈康等老师,三年开设该课程的经验费用安排:谷歌将负担培训期间的住宿、食宿费用(11月30日-12月5日)、场地和设备租赁费用、教材费以及讲师费等。但来回差旅费用请学员(学校)自理。5/5请有兴趣在云计算方面进行课程建设的老师,按照后一页的报名回执,填写信息之后反馈回谷歌公司:helenhu@google.com.谷歌中国大学合作部2009年10月28日5/5回执:Google(谷歌)云计算“基于大规模集群的海量数据处理技术”师资培训研讨班参加培训教师信息确认姓名学校名称教授课程手机号码电话E-mail

5、姓名学校名称教授课程手机号码电话E-mail联系人信息姓名电话手机E-mail胡斐然010-6250-440513911890519helenhu@google.com5/5附件、培训课程介绍基于大规模集群的海量数据处理技术课程简介:本课程是Google公司与清华大学合作,在清华大学开设的有关集群分布式编程的课程。通过本课程的学习,学员将深入了解到通过大规模集群的模式处理海量数据的方式与编程方法。通过实践相关的课程内容,使用开源的ApacheLuceneHadoop工具,学员将亲身实践Google文件系统以及Google所使用的分布式编程方式MapReduce

6、。学员还需要完成特定的分布式应用程序设计来巩固所学的编程知识,用于处理实际的海量数据问题。课程内容:1课程简介主要讲述分布式编程的模式,分布式编程所需要涉及到的相关知识,包括分布式的应用问题,并行与分布的基础,分布式的历史,并行编程与同步等的相关内容。2MapReduce编程技术主要讲述有关MapReduce编程技术的来龙去脉,相关的理论与技术实现,包括函数式编程语言的简介,大规模数据处理,MapReduce的编程模型,MapReduce编程实例,在实际编程中的错误处理以及优化等相关内容。3分布式系统的层次这一节的内容是对分布式编程内容的简介,包括网络的基本处

7、理,远程过程调用,事务处理系统的工作流程,可靠性等方面的内容。4分布式文件系统分布式文件系统是分布式编程的一块重要的内容,是构建上层应用的基础,用来存储各种应用的数据。本节的内容包括文件系统简介,网络文件系统NFS以及AFS相关的内容,Google使用的GFS(GoogleFileSystem)等相关的内容。5其它的分布式系统将通过具体的例子来讲述在实际的可运行的分布式系统的内部结构,内容包括域名系统,BOINC系统,PlanetLab等,这些内容为学员将来的研究提供入门的知识。提高的内容还包括google所使用的分布式锁技术Chubby以及分布式的结构化数据

8、处理方法BigTable。实验内容5/

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。