数据取对数的意义.doc

数据取对数的意义.doc

ID:56731074

大小:69.00 KB

页数:3页

时间:2020-07-06

数据取对数的意义.doc_第1页
数据取对数的意义.doc_第2页
数据取对数的意义.doc_第3页
资源描述:

《数据取对数的意义.doc》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、数据取对数的意义时间:2013-11-0601:23  浏览:2238人平时在一些数据处理中,经常会把原始数据取对数后进一步处理。之所以这样做是基于对数函数在其定义域内是单调增函数,取对数后不会改变数据的相对关系,取对数作用主要有:平时在一些数据处理中,经常会把原始数据取对数后进一步处理。之所以这样做是基于对数函数在其定义域内是单调增函数,取对数后不会改变数据的相对关系,取对数作用主要有:1.缩小数据的绝对数值,方便计算。例如,每个数据项的值都很大,许多这样的值进行计算可能对超过常用数据类型的取值范围,这时取对数,就把数值缩小了,例如TF-IDF计算时,由于在大规模语料库中,很多词的频率是非

2、常大的数字。 2.取对数后,可以将乘法计算转换称加法计算。 3.某些情况下,在数据的整个值域中的在不同区间的差异带来的影响不同。例如,中文分词的mmseg算法,计算语素自由度时候就取了对数,这是因为,如果某两个字的频率分别都是500,频率和为1000,另外两个字的频率分别为200和800,如果单纯比较频率和都是相等的,但是取对数后,log500=2.69897,log200=2.30103,log800=2.90308这时候前者为2log500=5.39794,后者为log200+log800=5.20411,这时前者的和更大,取前者。因为前面两个词频率都是500,可见都比较常见。后面有个词

3、频是200,说明不太常见,所以选择前者。从log函数的图像可以看到,自变量x的值越小,函数值y的变化越快,还是前面的例子,同样是相差了300,但log500-log200>log800-log500,因为前面一对的比后面一对更小。也就是说,对数值小的部分差异的敏感程度比数值大的部分的差异敏感程度更高。这也是符合生活常识的,例如对于价格,买个家电,如果价格相差几百元能够很大程度影响你决策,但是你买汽车时相差几百元你会忽略不计了。 4.取对数之后不会改变数据的性质和相关关系,但压缩了变量的尺度,例如800/200=4,但log800/log200=1.2616,数据更加平稳,也消弱了模型的共线性

4、、异方差性等。5.且所得到的数据易消除异方差问题。6.在经济学中,常取自然对数再做回归,这时回归方程为lnY=alnX+b,两边同时对X求导,1/Y*(DY/DX)=a*1/X,el=(DY/DX)*(X/Y)=(DY*X)/(DX*Y)=(DY/Y)/(DX/X)这正好是弹性的定义。dlnY/dlnX=(DY/Y)/(DX/X) 当然,如果数据集中有负数当然就不能取对数了。实践中,取对数的一般是水平量,而不是比例数据,例如变化率等。

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。