谁说菜鸟不回数据分析

谁说菜鸟不回数据分析

ID:20358827

大小:2.34 MB

页数:13页

时间:2018-10-10

谁说菜鸟不回数据分析_第1页
谁说菜鸟不回数据分析_第2页
谁说菜鸟不回数据分析_第3页
谁说菜鸟不回数据分析_第4页
谁说菜鸟不回数据分析_第5页
资源描述:

《谁说菜鸟不回数据分析》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第一章数据分析那些事1.1.4数据分析师的基本素质1、态度严谨负责2、好奇心强烈3、逻辑思维清晰4、擅长模仿5、勇于创新1.2数据分析6步曲1、明确分析的目的和内容为什么开展本次数据分析要解决的问题2、数据收集数据来源:数据库(公司业务数据)公开出版物(年鉴好报告)互联网市场调查(费用高,存在一定的误差,仅作参考之用)3、数据处理数据清洗数据转化数据提取数据计算4、数据分析掌握数据处理软件数据处理是数据分析的基础;数据挖掘是数据分析的高级阶段5、数据展现能用图表现就不用表格能用表格的就不用文字6、报告撰写把数据分析的起因。过程。结果及建议完整的呈现出来,以供决策者参

2、考好的分析框架图文并茂层次明晰要有明确的结论和建议和解决方案1.3常用术语平均数:将总体水平内个单位的数量差异抽象化,达标总体的一般水平,掩盖了总体内个单位的差异绝对数:客观现象总体在一点时间地点下的总规模总水平的综合指标。相对数:相对数=比较数值(比数)基础数据(基数)百分比:百分点:不同时期相对指标的变动幅度频数:重复出现的次数频率:出现次数和总次数比值比例:部分与整体的关系比率:整体内部之间的关系倍数:番数:原来数量2的N次方倍就说是N番同比:与历史时期进行比较的数值发展相对情况环比:与提前一个时期比较的数值逐期发展情况13第一章数据准备2.1理解数据2.1.

3、1字段与记录字段是事物或现象的某种特征记录是事物或现象的具体表现2.1.2数据类型:常用数据类型数字文字日期数据的两大类:1、字符型数据(不具备计算能力的文字数据)2、数值型数据(直接使用自然数或度量单位进行计算的数值数据)2.1.3数据表一维表二维表维指的是研究数据的角度2.1.4数据输入单选采取编码定义一个变量的方法多选:1、二分法把每一个相应的选项定义一个人变量如选了是“1”未选为“0”2、多重分类法事先定义录入的数值。排序题:方法和多重分类法相似预先定义输入的数值总结:尽可能的把数据转化为数字或者是简单的字符2.2初始excel宏:类似与计算机的程序但是它完

4、全运行于EXCel中或者说宏是可运行任意次数的一个操作或者是一组操作。学习了解常用的快捷键2.3数据来源2.3.1导入数据文本导入网站导入(可以自动更新数据)1.在手动输入数据前,先行设置单元格格式2.快速设置单元格格式:(1)Ctrl+1,弹出设置单元格对话框(Notsure)(2)Ctrl+Shift+#:日期(OK)(3)Ctrl+Shift+$:货币(OK)(4)Ctrl+Shift+%:百分比(OK)(5)0+Space:分数形式(NotSure)(6)“开始”选项卡->数字功能组中3.实现相同数据的快速录入(1)选中单元格,移动鼠标至该单元格右下角的填充

5、柄处,在指针变为黑色“+”时,按住鼠标左键,拖拽。并选择“填充序列”、复制单元格、仅填充格式、不带格式填充。(2)在一列非空白数据的后一列录入数据:先在该列第一个单元格录入一个数据,再在此单元格右下角调出“+”填充柄,用鼠标双击=>复制此单元格内容到此列其他单元格13(3)在单元格输入'007,可按照文本形式存储数字,左上角有绿色小三角标记第一章数据处理3.1何为数据分析三心二意:信心细心(1%错误=100%失败)平常心诚意合老板意3.2数据清洗3.2.1数据清理小妙招冻结窗口自动筛选快速隐藏Ctrl+箭头键Ctrl+shift+箭头键快速选择区域绝对引用相对引用混

6、合引用F4快速调整引用方式(按F4的次数来改变)3.2.2重复数据处理技术函数识别重复数据计算条件,其形式可以是数字表达式或文本例如:条件可以是32、“32”“>32”或者“apple”计数的单元格范围Countif(rang,criteria)筛选功能选择重复数据条件格式表示重复数据重复数据删除菜单操作删除重复项排序删除重复项通过筛选删除重复数据3.2.3处理缺失数据数据缺失值:数据集中某个或者某些属性的值是不完全的定位输入查找缺失数据处理缺失数据的常用方法:该变量的样本平均值代替缺失值13用一个统计模型计算出来的值去代替缺失值常用的有回归型和判断型将有缺失的值删

7、除将有缺失的值的个案保留填充缺少的空白先定位(crtl+G或者F5)再输入数据的平均值然后安crtl+enter熟悉各种常用的快捷键通配符模糊查找每一个“?”代表一个任意字符一个“*”代表任意多个字符3.2.4检查数据逻辑错误If+条件为false时输出的值为true时输出的值表示计算结果为true或者false的表达式If(logical_test,value_if_true,value_if_case)注意:a条件表达式是比较是比较运算符(<、=、>)建立的式子,无比较就无判断B两个值若是数值数据可以直接书写,若是文本数据需要加双引号标记C参数里所有用到的标

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。