主成分分析-支持向量回归建模方法及应用研究.pdf

主成分分析-支持向量回归建模方法及应用研究.pdf

ID:53003618

大小:257.62 KB

页数:6页

时间:2020-04-10

主成分分析-支持向量回归建模方法及应用研究.pdf_第1页
主成分分析-支持向量回归建模方法及应用研究.pdf_第2页
主成分分析-支持向量回归建模方法及应用研究.pdf_第3页
主成分分析-支持向量回归建模方法及应用研究.pdf_第4页
主成分分析-支持向量回归建模方法及应用研究.pdf_第5页
资源描述:

《主成分分析-支持向量回归建模方法及应用研究.pdf》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第34卷分析化学(FENXIHUAXUE)研究报告第5期2006年5月ChineseJOurnaIOfAnaIyticaIChemistry617~620主成分分析-支持向量回归建模方法及应用研究1,21,3”3侯振雨蔡文生邵学广123(中国科技大学化学系,合肥230026)(河南科技学院化工系,新乡453003)(南开大学化学系,天津300071)摘要将主成分分析(PCA)用于近红外光谱的特征提取,并与支持向量回归(SVR)相结合,实现了主成分分析-支持向量回归(PCA-SVR)用于近红外光谱定量分析的建模方法。

2、与单纯的SVR方法相比,不仅提高了运算速度,而且提高了模型的预测准确度。将PCA-SVR方法用于烟草样品中总糖和总挥发碱含量的测定,所得结果的预测均方根误差分别为1.323和0.0477;回收率分别为91.8%~112.6%和88.9%~120.2%。关键词主成分分析,支持向量回归,近红外光谱!"引""言主成分分析(PCA)已成为一种传统的数据分析方法,被广泛地应用于分析化学信号处理。将PCA应用于近红外光谱(NIR)的数据处理,不仅可以消除背景和噪音干扰,而且可以消除光谱响应的共线[1,2]性。支持向量机(SVM

3、)是基于统计学习理论提出的一种机器学习算法,在许多领域中得到了广泛[3,4]应用。支持向量机回归(SVR)是基于SVM理论建立的一种回归技术,具有泛化能力强和预测准确[5~9]度高等优点,在分析化学领域已得到了初步应用。但是,在具体的实际应用中仍然存在一些问题,[10]如当原始数据的变量较多时,SVR的计算速度较慢、参数优化困难等等。最近,有文献报道将PCA、[11,12]ICA等特征提取技术与SVM技术相结合应用于时间序列分析和金融数据分析等,既提高了运算速度,又提高了分类或预测准确度。本研究将PCA与SVR相结

4、合,建立了PCA-SVR建模方法并应用于烟草样品的NIR定量分析。结果表明,PCA-SVR方法不仅模型速度明显优于SVR方法,而且所建模型的稳定性也明显好于SVR模型。#"原理与算法PCA-SVR方法的基本思想是首先采用PCA对NIR数据进行特征提取,然后采用SVR进行建模。因此,该方法既具有PCA的数据压缩和降维功能,又具有SVR的非线性建模能力和普适性。关于PCA和SVR的原理和算法可参见有关参考文献,PCA-SVR方法的建模与预测步骤为:(1)对校正集NIR数据!n>(k其中n为样品数、k为光谱数据点数)进行

5、标准化,使之具有零均值、单位方差;(2)对标准化的!n>k进行PCA分析,得到得分矩阵"n>m和载荷矩阵#m>(k其中m为因子数);(3)采用SVR对"n>m和校正集的浓度进行建模;(4)对预测集NIR数据!p>(k其中p为样品数、-1k为光谱数据点数)进行标准化并进行特征提取,即计算"p>m=!p>(k#k>m),并利用所建立的SVR模型进行浓度预测。在本文的计算过程中,采用了误差(!)不敏感损失函数和径向基(RBF)核函数,即:-$i-$j2K($i,$j)=e2"2(1)式中$i和$j分别为不同样品的NIR光

6、谱,"为径向基函数的宽度。PCA的因子数(或主成分数)以及与SVR相关的参数!、"和正则化系数c的数值分别采用检验集样本进行优化。$"实验部分使用BrukerVectOr22/N近红外光谱仪(德国Bruker公司)测试了不同烟叶产区的110个粗烤烟叶-1-1样品,采用1cm间隔记录了4000~9000cm的光谱数据。样品的常规组分,即:总糖(TS)和总挥发2005-06-13收稿;2005-11-06接受本文系国家自然科学基金(NO.20325517)和教育部高等学校优秀青年教师教学科研奖励计划资助618分析化学第

7、34卷碱(TVA)的含量采用AutoAnaiyzerIII连续流动分析仪(德国BranLuebbe公司)按照标准方法进行测定。将110个样品的数据随机地分为3部分,其中60个样品的光谱数据用作校正集,20个样品的光谱数据用作检验集,其余30个样品的光谱数据用作预测集。参数优化过程中均以检验集的预测均方根误差(RMSEP)作为评价标准。4结果与讨论4.1主成分数与SVR参数的确定如上所述,PCA-SVR方法包括4个需要调节的参数:PCA的主成分数以及与SVR相关的参数!、"和正则化系数!。在建模过程中,首先利用检验集

8、对4个参数的取值进行了优化。图1为检验集的RMSEP随主成分数的变化情况,其中的每个RMSEP值均为20次运算的平均值,每次运算都随机地选取60个校正集和20个检验集样本。从图1可以看出,对于两种预测指标的RM-SEP的变化规律基本相同,即随主成分数的增加,首先快速下降,然后趋于平坦但仍逐渐减小。考虑到样品的复杂性、模型的通用性以及模型的预测准确性,对于总糖

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。