判別分析 - シミュレーション科学研究室

判別分析 - シミュレーション科学研究室

ID:8268363

大小:528.20 KB

页数:21页

时间:2018-03-15

判別分析 - シミュレーション科学研究室_第1页
判別分析 - シミュレーション科学研究室_第2页
判別分析 - シミュレーション科学研究室_第3页
判別分析 - シミュレーション科学研究室_第4页
判別分析 - シミュレーション科学研究室_第5页
资源描述:

《判別分析 - シミュレーション科学研究室》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、判別分析判別分析•どちらのグループ(クラスタ,群)に属しているかが分かっているデータがあるときに,まだ分類されていないデータがどちらのグループに属するかを推定する方法.•一般に,目的変数が質的変数,説明変数が量的変数となる多変量解析.•説明変数が質的変数である場合もダミー変数を用いることで同様に取り扱うことができる.判別分析•線形判別関数(lineardiscriminantfunction)–超平面・直線による方法•非線形判別関数–超曲面・曲線によるマハラノビス汎距離(Mahalanobis‘generalizeddistan

2、ce)による方法•重判別分析(multiplediscriminantanalysis)–3つ以上のグループに判別する方法線形判別できる,できない?2?2判別したいデータ?1?1判別分析の用語•目的変数–どちらのグループに属するかを示す変数.–2グループであれば,-1,1等と平均が0となるようにとる.•説明変数–目的変数を説明変数の関数として定義する.–説明変数は,量的変数(連続値)であっても良いし,質的変数(離散値)であっても良い.質的変数の場合は,整数値に変換する.線形判別関数目的変数=Σ係数×説明変数?=?0+Σ????こ

3、こで,係数??の求め方にはいくつかの方法がある.1.相関比が最大となるように定める方法2.重回帰式を当てはめる方法(こちらがわかりやすい)線形判別関数重回帰分析による方法1.説明変数・目的変数を数値化する.–Yes/Noを判別するような場合,目的変数は1,-1をとるようにする.(平均が0となるようにする.)2.回帰分析によって重回帰分析式を決定する.?=?0+Σ????3.目的変数?>0の場合Yes,?<0の場合Noなどと判別する.例題(学習データ)健康/病気因子1因子2健康805健康603病気1608病気1406健康904健康

4、406病気1807病気1506例題(判別データ)健康/病気因子1因子2?1508?20010?1108?706?22012?24012?1309?605学習データ準備y<-c(“Y”,“Y”,“N”,“N”,“Y”,“Y”,“N”,“N”)*ベクトルyを定義x1<-c(80,60,160,140,90,40,180,150)*ベクトルx1を定義x2<-c(5,3,8,6,4,6,7,6)*ベクトルx2を定義lda.data<-data.frame(x1,x2,y)*ベクトルx1,x,yをまとめる.lda.data*内容を確認x1

5、x2y1805Y2603Y31608N41406N5904Y6406Y71807N81506N判別ルール生成library(MASS)Call:*ライブラリMASSを読み込む,必須.lda(y~.,data=lda.data)lda.res<-lda(y~.,data=lda.data)Priorprobabilitiesofgroups:*線形判別関数を決定guru-punolda.resNY*結果を確認0.50.5Groupmeans:x1x2N157.56.75Y67.54.50Coefficientsoflineardi

6、scriminants:LD1x1-0.04658564x2-0.38882505学習データ判別精度確認lda.predict<-predict(lda.res)$class*学習データに対する予測精度の確認[1]YYNNYYNNLevels:NYlda.predict$posterior*結果の確認NY11.358316e-049.998642e-0122.350001e-081.000000e+0039.999999e-011.252082e-0749.992767e-017.232869e-0452.006802e-049

7、.997993e-0167.722117e-089.999999e-0171.000000e+007.995346e-0989.999317e-016.828594e-05$xLD111.75704923.4664123-3.1362774-1.42691551.68001863.2316507-3.6791658-1.892771判別データ準備x1<-c(150,200,110,70,220,240,130,60)x2<-c(8,10,8,6,12,12,9,5)lda.data2<-data.frame(x1,x2)判別デー

8、タ判別結果lda.predict2<-predict(lda.res,lda.data2)$class*lda.resの判別関数を用いて,lda.data2[1]NNNYNNNYLevels:NYのデータを判別する.$posteriorlda.predict2N

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。