《多元数据分析》PPT课件.ppt

《多元数据分析》PPT课件.ppt

ID:52275654

大小:204.96 KB

页数:25页

时间:2020-04-03

《多元数据分析》PPT课件.ppt_第1页
《多元数据分析》PPT课件.ppt_第2页
《多元数据分析》PPT课件.ppt_第3页
《多元数据分析》PPT课件.ppt_第4页
《多元数据分析》PPT课件.ppt_第5页
资源描述:

《《多元数据分析》PPT课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、多元数据分析刘国庆Question?Howtodetermineafairmarketvaluefortheproperty?Inbuildingthemodel,thegoalistopredictthemarketvalueoftheLeslieSaltproperty,usingtheinformationavailable.DataLeslieSaltData.txtRegressionAnalysisItisusedtoexploretherelationshipbetweenasetofindependentvariables(X’s)

2、andasingledependentvariable(Y).Aregressionmodelisalinearcombinationofindependentvariablesthatcorrespondsaspossibletothedependentvariable.RegressionforansweringquestionsHowcanwedescribetherelationshipbetweenthedependentvariableandtheindependentvariables?Istherelationshipdescrib

3、edbythemodelstatisticallysignificant?Whichindependentvariablesaremostimportant?Howwelldoesthemodelgeneralizetoobservationsoutsidethesample?资料预处理大多数的销售价格低于$10,000,但是有一些价格甚至高于$20,000or$30,000每亩;一般地,这种价值的差别会带来问题。为此,采用log函数。一些特殊的点需要排除VariablesDescriptionVariables.txtCorrelationMat

4、rixCorrMatData.txt分析从表3中可以看出与log(Price)高度关联的变量是Elevation,Sewer,Date,Flood.从表格中我们也可以看到在独立的变量之间也存在着相关性。比如,Elevation,County.回归模型ResultsofRegressionResultsRegress.txtHowgoodistheFit?HowgoodistheFit(continueI)OneofthedrawbacksofR^2isthatwheneveranindependentvariableisaddedtothemode

5、litalwaysincreases,nomatterhowsmallthecontributioninfit.Ingeneral,whenbuildingmodels,onewantstomakeatrade-offbetweenparsimonyandimprovementinfit.HowgoodistheFit(continueII)IsitSignificant?Testtheerrortermsarenormallydistributed;thatisTestingthemodelF-TestFTest.txtThecriticalva

6、luefortheF-distributionatthe0.01levelisF(4,26)=4.14,whichsuggeststhatourmodelishighlysignificant.DetectingproblemswiththemodelOnemeasureofmulticollinearityiscalledtheconditionindex(CI)Heteroscedasticity(异方差性)Wehaveassumedthattheerrortermsallhavethesamevariance.Thisassumptionis

7、sometimescalledhomoscedasticity.Whentheassumptionisviolated(i.e.,thevariancesarenotallthesame),wehavewhatiscalledheteroscedasticity.Weightedleastsquares(WLS)InfluentialObservationsSometimesregressionmodelresultscanbeinordinatelyinfluencedbyoneorafewobservationsinthedata.Thisty

8、peofobservationasanoutlier.DFBETAsWecanlookattheimpactoftheob

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。