基于模糊点数据的线性回归模型在判别分析中的应用.pdf

基于模糊点数据的线性回归模型在判别分析中的应用.pdf

ID:52456788

大小:241.23 KB

页数:4页

时间:2020-03-27

基于模糊点数据的线性回归模型在判别分析中的应用.pdf_第1页
基于模糊点数据的线性回归模型在判别分析中的应用.pdf_第2页
基于模糊点数据的线性回归模型在判别分析中的应用.pdf_第3页
基于模糊点数据的线性回归模型在判别分析中的应用.pdf_第4页
资源描述:

《基于模糊点数据的线性回归模型在判别分析中的应用.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第29卷第4期宁夏大学学报(自然科学版)2008年12月V01.29NO.4JournalofNingxiaUniversity(NaturalScienceEdition)Dee.2008文章编号:0253—2328(2008)04—0305—04基于模糊点数据的线性回归模型在判别分析中的应用沈菊红(北方民族大学信息与计算科学学院,宁夏银川75O021)摘要:在经典回归分析理论中,训练数据在回归方程的构建中是被同等对待的.然而,在许多实际问题中,训练数据的作用是不同的,通常有些训练数据比其他数据更重要.为此,给每个训练

2、数据赋予一个置信权重(这里的样本称为模糊点样本数据),并且给出了确定该置信权重的几种常用方法,讨论了基于模糊点数据的线性回归模型用于判别分析的情况.最后给出了数值例子.关键词:模糊点数据;最小二乘;判别分析分类号:(中图)O212.4;TP18(2000MR)文献标志码:A借助于Zadeh提出的模糊集理论,模糊数据分(溉,)是训练样本.给每个训练数据赋予一个模糊析也得到了比较充分的研究_】].H.Tanaka等人于隶属度s(0≤s≤1),可视其为对应的数据点对总1982年首先提出了模糊线性回归模型.Changl2]对体的

3、重要度或可信度.根据文献[5],称((,),s)2o多年来模糊回归分析的研究进行了比较,总结了为¨中的模糊点,和s分别叫作支撑点和高模糊回归的3种方法:最小化模糊性准则、最小二乘度.定义{(,),s:一1,2,⋯,)为模糊点集.拟合准则和区间回归分析方法;同时指出模糊回归为每个训练数据确定模糊隶属度的方法依赖于与经典回归之间的主要区别在于模糊回归视残差为数据表示的实际问题.通常,在给定的问题中选择合模糊变量,而经典回归视残差为随机变量.适的模糊隶属度并不困难,而且某种程度上具有主在许多实际问题中,每个数据对于总体来说有观

4、性.因此,模糊点数据能够表示人们对数据本身的不同的置信度或意义,为此,可以给每个数据赋予一先验信息.通常根据具体数据的不同特征确定隶属个模糊隶属度,使得不同数据对曲线拟合的贡献不度.首先,要确定隶属度的下界口(>0且足够小).同.受文献[3]的启发,将这里的样本称为模糊点样其次,需要选择数据集的主要特征并确定该特征与本数据.笔者在文献[4]中从一个新的角度将模糊性模糊隶属度之间的关系.下面给出为每一个训练数引入回归模型,重新推导了经典的最小二乘方法,本据确定模糊隶属度s的几种常用方法:文将此基于模糊点数据的线性回归模型应

5、用于判别1)在一些研究领域中,响应变量在每一个自变分析的情况.由于在判别分析问题中,各类在所分析的问题中所处地位不同,有的类可能比其他类更重量水平上需要测量多次,例如,对病人的血压进行测要.基于此,可以给每一类赋予一个置信权重,这样量,响应变量血压在不同的时间被测量,假设在t就可以根据需要将更重要的类尽量正确分类,对不太时间测量了7"/次,取这次的平均值作为观测值.重要的类允许有一些误分.数值模拟结果表明,依据本但由于每个水平上的测量次数不同,测量次数越多文的方法,重要的类的确被正确分开了,这也进一步说响应变量值越准确,

6、所以它们对曲线拟合越重要.因明模糊点权重越大的数据对拟合曲线越重要.此,可视n/为模糊权重(为总测量次数).2)当回归模型用于判别分析(discriminant1模糊点数据analysis)问题时,通常情况下,各个类在所研究的问假设x是维预报变量,y是一维响应变量,题中所处的地位不同,人们希望重要的类尽量被正收稿日期:2007—06—18作者简介:沈菊红(1970一),女,讲师,硕士,主要从事统计学、机器学习研究.306宁夏大学学报(自然科学版)第29卷确分类,而对不太重要的类允许有误分.此时,可以圈越大,它们对拟合曲线

7、的作用越大.从图1很容易选择模糊隶属度为类标识变量函数.例如,有和看出,权重越大的模糊点对拟合曲线的贡献越大,拟2类,可以选择S为类变量Y的函数:合曲线明显靠近权重大的数据.一式中n+,n一在(O,1)中取值.此外,还可以根据数据的先验信息确定,如果考虑每个样本数据与类中心的距离,则s就是样本点与类中心间距离的函数.3)假设给定一个有时间特性的数据点序列:(1,Y1,51,t1),(2,2,S2,t2),⋯,(X,Y,s,t),其中t≤。≤⋯≤t是数据点到达系统的时间.设s是时间t的函数,可以认为最后一个点是最重要的并且

8、选择5一f(t)一1,认为第1个点x是最不⋯一一经典线性回归;——本文线性回归图12种线性回归的拟合结果重要的且选择s一f(t)一(d>0)且充分小).如果想使得模糊隶属函数是时间的线性函数,可取3在判别分析中的应用一厂(ti)=H,当被解释变量是属性变量而解释变量是度量变如果是时间的次函数,可取量时,判别分析是合适

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。