《利用python进行大数据分析报告》读书笔记

《利用python进行大数据分析报告》读书笔记

ID:47081983

大小:24.06 KB

页数:39页

时间:2019-07-19

《利用python进行大数据分析报告》读书笔记_第1页
《利用python进行大数据分析报告》读书笔记_第2页
《利用python进行大数据分析报告》读书笔记_第3页
《利用python进行大数据分析报告》读书笔记_第4页
《利用python进行大数据分析报告》读书笔记_第5页
资源描述:

《《利用python进行大数据分析报告》读书笔记》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、实用文档《利用python进行数据分析》读书笔记pandas是本书后续内容的首选库。pandas可以满足以下需求:具备按轴自动或显式数据对齐功能的数据结构。这可以防止许多由于数据未对齐以及来自不同数据源(索引方式不同)的数据而导致的常见错误。.集成时间序列功能既能处理时间序列数据也能处理非时间序列数据的数据结构数学运算和简约(比如对某个轴求和)可以根据不同的元数据(轴编号)执行灵活处理缺失数据合并及其他出现在常见数据库(例如基于SQL的)中的关系型运算1、pandas数据结构介绍两个数据结构:Series和DataFr

2、ame。Series是一种类似于以为NumPy数组的对象,它由一组数据(各种NumPy数据类型)和与之相关的一组数据标签(即索引)组成的。可以用index和values分别规定索引和值。如果不规定索引,会自动创建0到N-1索引。#-*-encoding:utf-8-*-importnumpyasnpimportpandasaspdfrompandasimportSeries,DataFrame文案大全实用文档#Series可以设置index,有点像字典,用index索引obj=Series([1,2,3],index=

3、['a','b','c'])#printobj['a']#也就是说,可以用字典直接创建Seriesdic=dict(key=['a','b','c'],value=[1,2,3])dic=Series(dic)#下面注意可以利用一个字符串更新键值key1=['a','b','c','d']#注意下面的语句可以将Series对象中的值提取出来,不过要知道的字典是不能这么做提取的dic1=Series(obj,index=key1)#printdic#printdic1#isnull和notnull是用来检测缺失数据#pr

4、intpd.isnull(dic1)#Series很重要的功能就是按照键值自动对齐功能dic2=Series([10,20,30,40],index=['a','b','c','e'])文案大全实用文档#printdic1+dic2#name属性,可以起名字dic1.name='s1'dic1.index.name='key1'#Series的索引可以就地修改dic1.index=['x','y','z','w']DataFrame是一种表格型结构,含有一组有序的列,每一列可以是不同的数据类型。既有行索引,又有列索引,

5、可以被看做由Series组成的字典(使用共同的索引)。跟其他类似的数据结构(比如R中的data.frame),DataFrame面向行和列的操作基本是平衡的。其实,DataFrame中的数据是以一个或者多个二维块存放的(不是列表、字典或者其他)。#-*-encoding:utf-8-*-importnumpyasnpimportpandasaspdfrompandasimportSeries,DataFrame文案大全实用文档#构建DataFrame可以直接传入等长的列表或Series组成的字典#不等长会产生错误dat

6、a={'a':[1,2,3],'c':[4,5,6],'b':[7,8,9]}#注意是按照列的名字进行列排序frame=DataFrame(data)#printframe#指定列之后就会按照指定的进行排序frame=DataFrame(data,columns=['a','c','b'])printframe#可以有空列,index是说行名frame1=DataFrame(data,columns=['a','b','c','d'],index=['one','two','three'])printframe1#用字

7、典方式取列数据printframe['a']文案大全实用文档printframe.b#列数据的修改直接选出来重新赋值即可#行,可以用行名或者行数来进行选取printframe1.ix['two']#为列赋值,如果是Series,规定了index后可以精确赋值frame1['d']=Series([100,200,300],index=['two','one','three'])printframe1#删除列用del函数delframe1['d']#警告:通过列名选出来的是Series的视图,并不是副本,可用Series

8、copy方法得到副本另一种常见的结构是嵌套字典,即字典的字典,这样的结构会默认为外键为列,内列为行。#-*-encoding:utf-8-*-importnumpyasnpimportpandasaspdfrompandasimportSeries,DataFrame文案大全实用文档#内层字典的键值会被合并、排序以形成最终的索引p

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。