基于模型驱动数据挖掘的低阻油层识别方法.pdf

基于模型驱动数据挖掘的低阻油层识别方法.pdf

ID:48010388

大小:341.23 KB

页数:5页

时间:2020-01-14

基于模型驱动数据挖掘的低阻油层识别方法.pdf_第1页
基于模型驱动数据挖掘的低阻油层识别方法.pdf_第2页
基于模型驱动数据挖掘的低阻油层识别方法.pdf_第3页
基于模型驱动数据挖掘的低阻油层识别方法.pdf_第4页
基于模型驱动数据挖掘的低阻油层识别方法.pdf_第5页
资源描述:

《基于模型驱动数据挖掘的低阻油层识别方法.pdf》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、大庆石油学院学报第34卷第4期2010年8月JOURNALOFDAQINGPETROIEUMINSTITUTEVo1.34No.4Aug.2010基于模型驱动数据挖掘的低阻油层识别方法朱丽萍,李雄炎。,李洪奇。(1.中国石油大学(北京)计算机科学与技术系,北京102249;2.中国石油大学(北京)油气资源与探测国家重点实验室,北京102249;3.中国石油大学(北京)地球探测与信息技术北京市重点实验室,北京102249)摘要:基于多参数信息的低阻油层的识别属于高维、非线性的模式识别问题.结合研究工区低阻油层储层特征,

2、分析研究工区构造和沉积特征,以数据挖掘方法为基础,确定模型驱动数据挖掘的理论框架;以测井、岩心和试油的相关信息为源数据,利用聚类和关联分析获取敏感参数;以敏感参数为核心,采用决策树、贝叶斯网络、支持向量机和人工神经网络方法获得多参数组合的预测模型,并结合参数的物理含义和低阻油层的实际特征,对预测模型进行修正,改进预测模型的实用性.结果表明:利用模型驱动数据挖掘方法得到的最优预测模型,预测研究工区的低阻油层的识别准确率为9O.05%.关键词:模型驱动;数据挖掘;低阻油层;储层预测;特征参数;预测模型;识别中图分类号:T

3、EI9文献标识码:A文童编号:1000一i89I(201O)O4—0030一O50引言20世纪9O年代以来,由于低阻油层分布广、储量大、评价难、易遗漏,一直受到普遍的关注,是老井复查、二次开发、多次开发、高成熟精细勘探阶段的主要目标_】j.根据区块地质特征,定义低阻油层,形成基于低阻油层成因机理研究的低阻油层识别方法l_2,同时分类归纳算法中的支持向量机在低阻油层的识别中也有不同程度的应用].由于实际地质特征的复杂性和测井曲线的模糊性,使得基于成因机理的测井解释模型存在较大依赖性,反映在方法上是误差较大、评价及识别的

4、准确率较低.由于算法单一,基于支持向量机的识别方法仅考虑数据驱动,没有与地质和地球物理背景有效结合完善预测模型.因此,尽管支持向量机对小样本具有较强的学习和泛化能力,获得较高的识别率,但对未知领域低阻油层的发现缺乏指导意义.数据挖掘技术在油藏管理和油藏描述、提高采收率、精细勘探、地学数据处理等方面有不同程度的应用[。,可是没有形成系统的挖掘思路,受数据源的有限性和方法的单一性制约,并未在地质和地球物理背景下取得实质性的挖掘成果.笔者考虑模型驱动,形成模型驱动数据挖掘的理论框架,根据研究工区低阻油层的特征,以系统挖掘作

5、为指导,最大限度地获取各种属性之间的内在联系,生成预测低阻油层的模型,这对研究工区低阻油层的勘探开发具有一定的理论和实践意义.1基本原理1.1模型驱动数据挖掘’数据挖掘(DataMining)出现于2O世纪8O年代后期,是从海量数据中获取正确的、新颖的、潜在有用的、最终可理解的模式的非平凡过程口.在数据挖掘的早期研究中,算法的高效性和工具的灵活性是人们热衷的对象,但是现实世界中的各种限制被忽略了,致使考虑数据驱动所获取的知识大部分不具有实用性.为了克服数据挖掘算法和工具的“高效”与所获取知识的“低能”之间的矛盾,“领

6、域驱动数据挖掘(Do—main—DrivenDataMining)”被提出l1,即将相关领域的先验知识作为附属条件,使其参与挖掘过程,利收稿日期:2OlO一03—26;审稿人:袁满;编辑:任志平基金项目:国家高新技术研究发展计划863项目(2009AA062802)作者简介:朱丽萍(1973),女,硕士,副教授,主要从事数据挖掘、计算机网络方面的研究·3O·第4期朱丽萍等:基于模型驱动数据挖掘的低阻油层识别方法用该条件的限制作用,对所获取知识的实用性进行检验,确保最终挖掘所得知识对于目标事物具有足够的有效性.对储层评

7、价和流体识别领域,各种解释和评价模型蕴含着丰富的领域知识,因此传统的解释和评价模型可以作为储层评价和流体识别领域的背景知识,参与和限制整个挖掘过程,将其有效地融合于数据挖掘的理论框架中,即“模型驱动数据挖掘”,其主要方法有聚类分析、关联分析和分类归纳等算法.1.1.1聚类分析将物理或抽象对象的集合分成相似的对象类的过程称为聚类,它是一种在无监督的情况下根据对象问的相似程度自动地将其分割为一组有意义的类的处理过程口.无监督是指待分类对象没有预先给定的类标识;有意义是指聚类的结果应该反映原始数据的自然结构特征.聚类分析的

8、三要素为相似性测度、聚类准则和聚类算法.对单一属性,聚类分析可以通过聚类而间接实现连续型数据的离散化,是一种数据归约的形式,即以区间的形式分割数据;对多个属性,聚类分析按不同的试油结论进行聚类,可以间接获取不同参数组合对目标储层的敏感性.1.1.2关联分析关联分析是发现无明确因果关系的属性之间内在联系最有效的方法之一,以支持度和置信度为主、提升

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。