非负矩阵分解基向量分析及其在矿产预测中的应用.pdf

非负矩阵分解基向量分析及其在矿产预测中的应用.pdf

ID:52273646

大小:1.68 MB

页数:6页

时间:2020-03-26

非负矩阵分解基向量分析及其在矿产预测中的应用.pdf_第1页
非负矩阵分解基向量分析及其在矿产预测中的应用.pdf_第2页
非负矩阵分解基向量分析及其在矿产预测中的应用.pdf_第3页
非负矩阵分解基向量分析及其在矿产预测中的应用.pdf_第4页
非负矩阵分解基向量分析及其在矿产预测中的应用.pdf_第5页
资源描述:

《非负矩阵分解基向量分析及其在矿产预测中的应用.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、地质学刊第37卷第1期doi:10.3969/j.issn.167413636.2013.01.81非负矩阵分解基向量分析及其在矿产预测中的应用张洁1,刘石华2,李鸿镇2,初晓凤1,任雅丽1,余先川1(1.北京师范大学信息科学与技术学院,北京100875;2.广东省地勘局722地质大队,广东汕头440500】摘要:针对矿产预测数据具有复杂性以及矿质异常信息具有稀疏性的问题,基于非负矩阵分解的非负性和降维的特点,结合稀疏性,提出一种基于NMF基向量分析的矿产预测数据处理方法,并对基向量和原变量以及基向量之间的关系

2、进行分析。广东新寮岽铜多金属矿区数据实验结果表明,NMF方法在不同特征值和相似稀疏度的条件下的基向量形态基本稳定,在保留找矿信息的同时可有效地实现对矿产预测数据的稀疏化。NMF方法对于矿产预测具有重要的实际意义。关键词:矿产预测;非负矩阵分解;化探数据;R型聚类;基向量;稀疏度;广东中图分类号:TP392文献标识码:A文章编号:1674—3636(2013)01一008l一06O引言矿产预测是指结合地质学、数学、信息学以及计算机等技术与理论,通过分析成矿地质数据,深入研究矿产与矿化信息和成矿规律,预测成矿区域并

3、对之作出评价。许多学者对此进行了大量的研究工作(成秋明,2000,200l;赵鹏大,2000;余先川等,2011),其中,利用地质、矿产、遥感、地球物理和地球化学等多种信息进行资源评价的综合信息矿产资源定量预测(王世称,2002)是目前矿产资源预测的主流方法。如何从海量地质矿产数据中提取有效致矿信息是矿场预测的一个关键环节。但由于地质数据具有复杂性且致矿异常具有稀疏性。使用传统的数据处理方法如多元统计分析、线性空间信息统计、空间多元统计分析成分数据分析以及成分分析等,往往具有一定的局限性,这使得从海量矿产数据中

4、有效提取属于“弱信息”的找矿信息非常困难,数据挖掘效果不理想,不能很好地表征矿产特征。例如,主成分分析方法只考虑了数据的低阶统计特性,没有考虑高阶统计特性(Leeetal,2000),对于复杂的矿产预测数据不能很好地表征矿产资源特征。非负矩阵分解(NMF)(Leeetal,1999)是一种数据处理方法,不仅保留了原始数据矩阵的非负性,并且有降维和稀疏的特征。笔者用NMF方法对矿产预测数据进行处理,以广东新寮岽铜多金属矿区数据为研究对象,通过R型聚类分析研究变量间的相关关系,对相关性较高的聚类结果进行NMF分解,

5、讨论基向量和原变量以及基向量之间的相互关系。实验结果表明,在不同特征值和在稀疏度相似的条件下,NMF的基向量形态基本稳定,将NMF应用于矿产数据处理不仅实现了对原始数据的稀疏化,同时还有效地保留了属于“弱信息”的找矿信息。实验结果证明NMF对于矿产预测有重要的实际意义。1非负矩阵分解理论非负矩阵分解是最近十几年新提出的一种矩阵分解算法。该算法在分解过程中加入了所涉及矩阵及其元素均为非负的约束条件,从而实现了完全不同的矩阵分解结果。Paatero等于1994年发表的论文中首次提出了非负矩阵分解的思想,Lee等于1

6、999年在《Nature》上首次提出NMF的概念,随后又对NMF进行了改进(Leeeta1,2001)。随后,NMF成为信息领域的研究热点之一,广大研究者又推广收稿日期:2012一12—10;编辑:陆李萍基金项目:国家自然科学基金(41072245;40672195)作者简介:张洁(1977一),女,博士研究生,主要研究方向为机器学习与数据挖掘,E—mail:zhaIl舀ieswan@163.com82地质学刊2013年3月和改进了NMF方法(Guillametetal,2001;Hoyer,2004;Pauc

7、aetal,2006;Rutkowskietal,2007;Xueetal,2006)。下面是NMF理论的数学模型。y为原始非负矩阵,W和日为分解后得到的非负矩阵,w是数据矩阵y线性逼近的一组基,而日则是样本集的投影系数,且:y=W:H+E,y∈R“。”,埘ER4”,日∈R““(1)其中,对于给定的n维向量集合n为变量个数,m为集合中的数据样本个数,r为基向量的个数,原始数据矩阵y可以分解为基矩阵W和权重系数矩阵日的乘积与误差矩阵E之和。为简单起见,不考虑误差的因素,模型可简化为:ry。i一(wr日)Ⅱ=,∑1

8、W&日tf(2)其中,y是非负矩阵y中的元素,彬。和巩是因子矩阵w和日中的元素。一般情况下,应满足r≤m,n且(n+m)r

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。