探索性数据分析的方法在职工平均工资中的应用caj.pdf

探索性数据分析的方法在职工平均工资中的应用caj.pdf

ID:52453161

大小:529.16 KB

页数:2页

时间:2020-03-27

探索性数据分析的方法在职工平均工资中的应用caj.pdf_第1页
探索性数据分析的方法在职工平均工资中的应用caj.pdf_第2页
资源描述:

《探索性数据分析的方法在职工平均工资中的应用caj.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、张璇:探索性数据分析的方法在职工平均工资中的应用电子商务探索性数据分析的方法在职工平均工资中的应用张璇(中南财经政法大学,湖北武汉430073)[摘要]职工平均工资是一个重要的指标,它既关系到了劳动者的自身利益,又是政府制定政策时的依据。本文介绍了探索性数据分析的主要特点,充分运用该分析方法对华东六省的职工平均工资进行描述性数据分析,绘制了箱线图,进行对称变换和匹配变换,排除局部的异常值干扰,重点关注了总体数据特征。[关键词]探索性数据分析;职工平均工资;匹配变换[中图分类号]G819[文献标识码]A[文章编号]1005-6

2、432(2013)46-0099-02续表1引言职工平均职工平均职工平均探索性数据分析方法是一种新型的统计分析手段,近省份城市工资省份城市工资省份城市工资年来在许多行业得到了广泛的应用,并取得了明显成效。(元)(元)(元)其强调了数据本身的价值,可以更加客观地发现数据的规江苏盐城30462.78福建龙岩30834.46安徽安庆27985.87律,找到数据的稳健耐抗模式,从而发掘出数据的隐藏信江苏扬州35432.99福建宁德31296.86安徽黄山30660.23息。本文从职工平均工资的实际数据出发,利用探索性数浙江杭州487

3、71.9江西南昌35037.98山东济南37853.89据分析中的工具,直观地探索华东六省职工平均工资的规浙江宁波43476.23江西景德镇23247.17山东青岛37803.49律,挖掘数据特征和有价值的信息。浙江温州37605.46江西萍乡25337.92山东淄博33896.672华东六省职工平均工资的描述性分析浙江嘉兴36317.44江西九江24746.15山东枣庄30440.82职工平均工资指企业、事业、机关单位的职工在一定浙江湖州36485.42江西新余31439.6山东东营41197.76时期内平均每人所得的货币

4、工资额。它表明一定时期职工浙江绍兴35124.47江西鹰潭23443山东烟台34193.93工资收入的高低程度,是反映职工工资水平的主要指标。浙江金华39468.96江西赣州23600.56山东潍坊33710.57由于中国城市众多,各地经济发展水平有较大的差异,生浙江衢州44053.96江西吉安23096.94山东济宁35820.8活水平和生活质量也各有不同,为了缩小地理差异对研究数据的影响,得到较为准确和有意义的结果,这里只选用浙江舟山43635.67江西宜春23843.3山东泰安30904.21了2010年华东地区六个省

5、的职工平均工资运用探索性数注:数据来源于国泰安数据库据分析方法做初步的描述性分析和研究,每个省选取了9个大城市。为了更加简单直观地对比各个省市的数据,我们绘制了箱线图,如图1所示。对华东六省进行对比中,可以看华东六省2010年职工平均工资水平到只有江西省和福建省是有离群值的,说明了这两省中存职工平均职工平均职工平均在着个别城市职工平均工资与同省其他城市相比特别大,省份城市工资省份城市工资省份城市工资其他几省的数据就不存在离群值。对于四分展布,可以得(元)(元)(元)到大小关系,安徽>江苏>浙江>山东>福建>江西,可江苏南京4

6、8781.69福建福州34804.48安徽合肥39290.84知安徽和江苏中城市的职工平均工资差异较大,福建和江江苏无锡47004.39福建厦门40282.94安徽芜湖36593.68西相比起来,则分布得更加集中。江苏徐州34244.07福建莆田27814.62安徽蚌埠28706.94综合对比各个省的中位数,可以发现江苏省平均职工工资水平最大,江西省最小,从经济上反映了地区经济发江苏苏州45567.59福建三明30603.08安徽淮南45863.17展差异,江苏紧靠上海,处在华东的中心,交通系统发江苏南通39445.86福建

7、泉州28907.87安徽马鞍山42964.81达,同时,长三角江苏占了大部分,其靠海的地理优势给江苏连云港33837.43福建漳州29537.45安徽淮北43009.75它带来了更多的经济发展机会,导致了职工工资水平中位江苏淮安32781.87福建南平28320.61安徽铜陵36641.39数相差如此大。2013.1299电子商务中国市场2013年第46期(总第761期)因此,接下来在进行匹配变化的时候,使用变换:T(x)=21/x,最后,根据公式和R软件,得到匹配变换为:121z=35764.95-6.78×102x由图3

8、可以看出,在进行对称匹配变换之后,江西省的两个离群值消失了,数据变得更加集中,趋势也更加易于分析和研究。这样的数据会给分析带来便利,更加清晰和直观地表现出数据的本质特征。图1华东六省2010年职工平均工资水平箱线图同时可以直观地看出安徽省数据对称性最好,除了福建省数据呈现左偏趋势外,其他省

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。