APP下载

莱州湾凹陷垦利油田沙河街组储层渗透率评价模型研究

2021-11-05汪瑞宏李志愿王玥天蔡文浙

高校地质学报 2021年5期
关键词:垦利渗透率粒度

汪瑞宏,齐 奕,李志愿,马 超,王玥天,蔡文浙

1. 中海石油(中国)有限公司 天津分公司,天津 300450;

2. 中国石油大学(北京)油气资源与探测国家重点实验室,北京 102249;

3. 中国石油大学(北京)地球探测与信息技术北京市重点实验室,北京 102249

渤海南部海域垦利构造处于莱北低凸起南界大断层下降盘、莱州湾凹陷的北洼,整体为依附于莱北1号断层发育的大型半背斜构造。该油田成藏位置有利,圈闭规模大,南盘主体区沙河街组圈闭面积可达到40 km2。其整体为复杂断块油藏,油藏类型应为层状构造油藏(杨波等,2011)。垦利油田沙河街组储层物性以中孔、中渗为主;岩性从粉砂岩至中砂岩均有分布。储层粒度变化大,孔隙结构复杂,非均质性较强,相同孔隙度条件下储层渗透率的差异可达到1~2个数量级。平面上油层埋深差别大、产能变化大。研究和建立准确、适用的储层渗透率评价方法和模型非常必要。

除早期的经典理论模型外,孔隙(岩石)介质渗透率评价方法可以分为统计、核磁、试井或测试法、智能算法等几类。经典理论模型以Purcell模型为代表(Purcell,1949),把毛管束模型引入到达西定律,导出下式:

式中K为渗透率(×10-3μm2);r为介质孔隙平均毛管半径(um);Φ为孔隙度(%)。

该模型的物理意义非常清楚,如果介质孔隙介质可以等价为不同半径的毛细管,该孔隙介质的渗透率与其孔隙度呈正比、与其孔隙平均毛管半径的平方呈正比。大量砂岩储层根据压汞毛管压力资料计算出的实验样品平均孔喉半径与样品渗透率存在幂函数统计关系,表明公式(1)不仅具有理论意义,也具有普遍意义。

Kozeny及其它作者先后在公式(1)的基础上引入了曲折度、岩石比表面积或束缚水饱和度等参数并对其进行了完善和延伸(Kozeny, 1927; Carman,1937; Timur, 1968)。

上述理论模型为后来建立多种形式的渗透率多元统计模型提供了理论依据。基于砂岩储层样品实验数据,Timur最早建立了孔隙度—束缚水饱和度二元回归渗透率统计模型

式中Swi为束缚水饱和度,单位为%。

该模型在储层渗透率评价中影响深远,当今在核磁测井渗透率评价广泛应用的Coates模型属于此类模型(Coates et al.,1991)。曾文冲(1979)对渤海湾盆地多套砂岩储层大量岩心分析数据统计研究发现,岩石粒度和孔隙度是决定储层渗透率的两个最重要参数,建立了粒度—孔隙度二元回归统计模型

式中Md为粒度中值(mm)。

随着人工智能的发展,应用机器学习方法进行渗透率评价成为了新的研究趋势。诸如主成分分析(潘华贤等,2009)、支持向量机(Anifowose et al.,2014)、神经网络(段友祥,2017)等比较成熟的机器学习模型已被证实在渗透率评价中具有计算精度优越性,但仍需结合不同地域储层具体特征进行建模。而更加新颖的深度学习或集成学习方式,例如径向基神经网络(Shao et al.,2019)、随机森林(Mohamed and Verdin,2019)也被尝试利用至更加复杂的基于二维图像下的渗透率评价,其应用性及推广性有待于未来继续深入研究。

本文通过分析目标储层岩石物理特征,明确了影响储层渗透率的主要因素。利用部分岩心数据,建立了孔隙度—粒度二元回归模型。根据检验样本集岩心渗透率结果与模型预测结果误差对比,系统分析了上述统计模型和BP神经网络的结构、输入等参数变化对模型预测精度的影响。在经过网络结构及输入参数的优化后,BP神经网络模型精度明显优于二元回归统计模型精度。利用优化后的BP神经网络预测模型和二元回归统计模型对三口井测井资料进行了应用评价,BP神经网络模型渗透率预测结果更加合理,可望在后续的油层产能评价中发挥作用。

1 目标储层基本概况

垦利油田位于渤海南部海域,其构造处于莱北低凸起南界大断层下降盘、莱州湾凹陷的北洼。钻井在垦利油田揭示的地层自上而下分别为第四系平原组,新近系明化镇组和馆陶组,古近系东营组和沙河街组。其中沙河街组自上而下分为沙一段至沙四段,沙三段可进一步划分为沙三下亚段、沙三中亚段和沙三上亚段,含油系主要发育于古近系沙河街组沙三上段和沙三中段I油组及II油组(岳红林等,2019)。

目标储层岩石以岩屑长石砂岩为主。铸体薄片粒度主径主要分布在0.05~0.5 mm之间,分选中等,以细砂岩及中砂岩为主,少量粉砂岩、粗粉砂岩和不等粒砂岩(图1)。粘土矿物以伊利石和伊/蒙混层为主,伴随少量高岭石及绿泥石,储层粘土矿物平均含量约为7.63%。

图1 垦利油田沙河街组岩石岩性统计频率直方图Fig. 1 Statistical frequency histogram showing the lithology of the Shahejie Formation, KL oilfield

研究区目标储层共有物性分析样品126个、具有物性数据的粒度样品40个。岩心分析数据表明,沙三上段与沙三中段储层物性特征统一,基本无差异。孔隙度分布范围很广,主要分布在5.5%~30%之间,平均值为22.6%;渗透率主要分布在1~1000 mD之间,占比83.5%,平均值为192.8 mD,储层物性以中高孔、中高渗为主。(图2)。

图2 垦利油田沙河街组岩心孔—渗关系图Fig. 2 Relationship of porosity and permeability of theShahejie Formation cores, KL oilfield

储层岩性或粒度对储层孔隙度、尤其对储层渗透率控制作用明显。图3为取心层段激光粒度确定的不同类型岩石的孔隙度—渗透率关系。粉砂岩孔隙度和渗透率较低,随着岩性变粗,细砂岩和中砂岩的孔隙度和渗透率不断增加。岩石颗粒粒度对储层岩石的渗透率影响作用非常明显(图4)。本文所研究的目标储层与渤海湾盆地其它油田沙河街储层类似,储层岩石颗粒平均粒径与泥质含量(在本文研究中使用了细粉砂、粘土矿物粒级组分含量之和)相关性明显(图5),对储层渗透率控制作用显著。

图3 垦利油田沙河街组不同粒级下孔—渗关系图Fig. 3 Relationship of porosity and permeability of the Shahejie Formation cores under different levels of granularity, KL oilfield

图4 垦利油田沙河街组粒度中值与岩心分析渗透率关系Fig. 4 Relationship of porosity and permeability of the Shahejie Formation cores

图5 垦利油田沙河街组储层岩心泥质含量与粒度中值关系Fig. 5 Relationship of Vsh and Md of the Shahejie Formation cores, KL oilfield, KL oilfield

垦利油田测井包括了电缆及随钻两种方式。取心井、探井及部分开发井为电缆方式测井,另一部分开发井为随钻方式测井。本次研究基于电缆测井方式的数据进行,包括了自然伽马测井,井径测井、自然电位测井,三条电阻率测井以及三孔隙度测井。其中自然伽马曲线可反映粒度信息,三孔隙度曲线反映孔隙度及粒度的双重信息,而电阻率曲线与储层渗透率存在着一定非线性关系(Mohamed,2019)。而井径曲线不反映储层孔隙度或粒度大小;自然电位虽可反映粒度信息,但曲线分辨率较低,在储层处,尤其是相对较薄储层处,其与粒度的关系趋势不明显,故本次研究未将该两条曲线作为评价模型输入对象。

2 渗透率评价模型

2.1 孔隙度—粒度二元回归模型

储层岩石粒度对渗透率具有明显的控制作用。参考式(3)孔隙度—粒度经验方程形式,利用目标储层取心样品孔隙度、粒度中值数据经拟合建立渗透率统计模型如式(4):

式中K为渗透率(×10-3μm2);Φ为孔隙度(%);Md为粒度中值(mm)。

粒度中值可根据式(5)由泥质含量进行求取

式中Vsh为泥质含量(%)。

2.2 BP神经网络回归模型

在实际井下条件地层,传统计算方式由于具有明确的理论模型基础及解析表达式,被广泛应用于评价储层渗透率,输入相应的孔隙度及粒度中值(泥质含量)后可以得到对应的渗透率数值。但实际地层往往复杂多变,仪器响应、多种岩性互相叠加以及储层流体等影响都会进一步的对渗透率造成难以用传统解析表达式加以描述的非线性变化。

基于机器学习的回归模型,可以寻找普通解析式难以量化的非线性变化,并进行高精度预测,其可以在保证地层实际信息最大化前提下,对渗透率进行高精度计算。对于本油田,具有岩心渗透率分析的可参与学习的样本数最大为126,输入向量维度最高为6,且不涉及新型测井数据(核磁共振、高分辨率电成像测井)。根据此数据规模大小,本文选用BP神经网络进行渗透率模型的建立工作。

BP神经网络是一种按照误差逆传播算法训练的多层前馈网络。如图6,它由输入层、输出层、隐含层共三个部分组成。每一个节点与邻层的各个节点相互连接,同一个层的各个节点不相连(樊振宇,2011)。假设BP神经网络的输入矢量为x∈Rn,其中x=(x0,x1,…xn-1)T;隐含层有n1个神经元,其输出为x′∈Rn,x′ =(x0′ ,x1′, …xn′-1)T;输出量为y∈Rm,其中y=(y0,y1,…ym-1)T。输入层到隐含层的权值为ωij,偏置单元值为θj;隐含层到输出层的权值为偏置单元值为θk′;网络层数为L,即输入层至隐含层及隐含层至输出层的神经元输出如下:

图6 神经网络结构Fig. 6 Simplified structure of neural network

显然,它可完成n维空间输入矢量至m维空间下输出矢量的映射,其中连接各层之间的激活函数为具有连续可导的Sigmoid函数,表达式如下:

类似传统回归,神经网络学习规则仍是使得通过均方误差准则构造的代价函数最小化,设有P个学习样本数据矢量,对应期望输出为d(1),d(2),…,d(p)为防止过拟合,添加正则化项。其目标函数表达如下:

为了寻求代价函数最优解,需要求解上述代价函数对及的偏导数。利用反向传播算法(Back Propagation Algorithm)通过推导即可对偏导数进行求解,进而利用最优化方法进行迭代优化求取最小值从而得到回归系数。

3 模型计算结果误差比较及模型优化

3.1节中模型预测结果精度对比分析及BP神经网络结构优化分析时,使BP神经网络模型训练样本集与孔隙度—粒度模型保持一致,旨在单纯客观对比两种模型预测结果准确性。3.2节中研究BP神经网络模型的输入优化问题时,为保证数据利用率,训练样本集的数量是全部物性数据的70%。以下所有模型进行误差对比所用的检验样本集保持一致,数量为全部物性数据的30%。两种样本集样本数据的选择是考虑样品孔隙度、渗透率范围代表性而随机选择的。

学习采用Levenberg-Marquardt优化算法进行神经网络训练,学习速率设置为0.1,最大训练次数设置为500。在训练时,随着训练次数的增加,训练样本均方根误差逐渐降低;而检验样本均方根误差首先减小,后由于过拟合导致其均方根误差呈增加的趋势。故在模型训练时,选择检验样本集均方根误差极小值处对应的训练次数时得到的网络模型为最终网络模型。

3.1 模型误差对比及BP神经网络结构优化

本次研究利用(1)岩心分析孔隙度以及粒度中值作为BP神经网络输入向量,岩心渗透率作为输出;(2)声波时差、补偿密度、补偿中子、自然伽马相对值测井数据以及两种电阻率比值(RD/RMLL、RS/RMLL)作为输入向量,岩心渗透率作为输出。设置隐含层节点数为10或20个、隐含层数为1层或2层,进行学习得到对应回归模型。分别计算不同模型检验样本集的平均相对误差,结果如下表。

在一定条件下,BP神经网络模型可以获得更加优于传统模型的计算效果。当仅使用孔隙度、粒度中值作为BP神经网络输入时,其计算精度不高于使用同样输入的传统模型的计算精度。机器学习回归的优势是在于可以寻找难以通过传统解析式表征的复杂映射,但当这种映射关系相对清晰且容易通过经验判断时,使用基于物理模型且具有解析表达式的方法进行渗透率预测往往更加具有优势。而当使用可表征岩心孔隙度、粒度大小的三条孔隙度曲线及自然伽马相对值曲线,并引入电阻率比值作为辅助输入时,BP神经网络模型的计算精度高于传统孔隙度—粒度二元回归模型。

模型网络结构同样可以对预测效果产生影响。隐含层数或隐含层节点数的增加意味着模型可以逼近真实映射关系的潜力的增加,一定程度上可降低计算误差,但同时也意味着模型复杂程度的增加,往往伴随着过拟合风险的增大及泛化能力的衰减。对于本研究问题,认为双隐含层、隐含层节点数为10的网络复杂度与问题复杂度最为匹配;单隐含层、隐含层节点数为20的网络复杂度其次;高于这个复杂度则存在预测结果误差增大。所以,在实际建模的过程中可以适当提高隐含层层数或隐含层节点数达到增加模型计算精度的目的,但同时需要考虑计算复杂程度和潜在的过拟合风险,即不恰当的结构复杂度导致对训练样本数据的过度拟合,反而降低了模型的泛化能力、预测精度下降。

3.2 BP神经网络输入参数优化

从理论上,BP神经网络模型的输入数量没有限制,这是其优势。但使用时不能无限输入。需要对输入的数据进行优化分析,根据因果控制关系或因果相关性,尝试不同的输入参数或演化参数,最终以模型检验样本集预测结果误差最小化原则确定最终计算模型。将输入参数分为三类:(1)与孔隙度相关,包括三孔隙度曲线;(2)与粒度相关,包括自然伽马曲线;(3)辅助因素输入,包括不同电阻率比值曲线。根据上文分析结果,选取最优网络结构,分别计算不同输入组合下的模型预测误差。

不同的输入类别组合对渗透率预测结果精度提高所占的权重不同。当同时使用三类数据作为输入时,检验样本集平均相对误差低至37%(表2—表5中最后一行)。分析表2数据,缺失孔隙度有关输入时,模型计算精度衰减量最大(图7a),缺失辅助因素输入时其衰减量最小(图7c)。对应为其对最终预测结果准确性权重占比由大至小。

图7 垦利油田不同输入组合模型计算结果分析Fig. 7 Calculation results analysis of different combination of reservoir input, KL oilfield

表2 垦利油田不同输入组合下模型计算误差Table 2 Average relative error of different combination of reservoir input, KL oilfield

每一类别中的不同曲线及组合也会对模型预测的精度造成影响。如表3所示,中子、密度曲线作为输入时,其模型计算精度与三孔隙度输入下的计算精度差别最小;密度、声波曲线作为输入时其次,而中子、声波曲线作为输入时差别最大。故密度曲线对模型影响权重最大,中子曲线其次,声波曲线影响最小。图8b, c显示,当使用包含密度曲线的其中两种孔隙度曲线作为输入时,模型计算效果与三孔隙度为输入时的计算效果基本一致。而使用中子、声波曲线作为输入时(图8a)其计算精度具有可见的相对明显的降低。根据表4及图9可知,当仅仅使用其中一种电阻率比值时,模型计算结果基本无区别。经分析可知,两种电阻率比值曲线存在着高相关性线性关系,其数据冗余度高。

图9 垦利油田不同电阻率比值曲线下模型计算结果分析Fig. 9 Calculation results analysis of curves with different resistivity ratios, KL oilfield

表4 垦利油田不同电阻率比值曲线下模型计算误差Table 4 Average relative error of curves with different resistivity ratios, KL oilfield

图8 垦利油田不同孔隙度曲线组合下模型计算结果分析Fig. 8 Calculation results analysis of different combination of porosity curve, KL oilfield

表3 垦利油田不同孔隙度曲线组合下模型计算误差Table 3 Average relative error of different combination of porosity curve, KL oilfield

当改变输入向量的数据形式,模型预测准确性可能发生变化。如表5所示,视孔隙度仅是在其对应孔隙度曲线的基础上进行简单线性变换,故使用对应视孔隙度替代三孔隙度曲线作为输入向量时,模型预测结果无变化(图10a)。而将自然伽马相对值变为自然伽马绝对值会对模型预测精度造成极大影响(图10b),其原因是由于未进行单井归一化的自然伽马绝对值曲线难以准确反应颗粒大小的变化情况,从而导致预测效果相对较差。将电阻率比值变换为电阻率绝对值,同样会导致预测精度下降(图10c)。其由于电阻率绝对值大小主要反映储层含油性,信息冗杂度高,不适宜作为渗透率预测模型的输入向量。

图10 垦利油田不同输入向量数据形式下模型计算结果分析Fig. 10 Calculation results analysis of models with different inputs of vector data, KL oilfield

表5 垦利油田不同输入向量数据形式下模型计算误差Table 5 Average relative error of models with different inputs of vector data, KL oilfield

经优化,以双隐含层、隐含层节点数为10的网络结构;训练样本集的数量是全部物性数据的70%;三孔隙度、自然伽马相对值、RD/RMLL为输入的模型为最终BP神经网络模型。使用孔隙度—粒度二元回归、优化后的BP神经网络模型对取心井KL-2、KL-3、KL-5进行计算,模型计算结果分析如图11、12所示。结果显示,BP神经网络泛化能力强,且计算表现优于孔隙度—粒度二元回归模型。以KL-2井为例(图13),第9道为使用孔隙度作为自变量,渗透率作为因变量回归得到的单孔隙度模型计算得到的渗透率;第10道为应用孔隙度—粒度二元模型计算得到的渗透率;第11道为应用BP神经网络模型计算得到的渗透率。观察取心段X550—X560 m处三种模型计算得到的渗透率与岩心覆压渗透率的对比结果可知,优化后的BP神经网络模型具有最高的计算准确性。

图11 神经网络模型训练及验证数据集计算结果分析Fig. 11 Neural network model training and test of calculation results analysis

当实际渗透率较小时,利用孔隙度—粒度二元回归模型可能会出现计算结果偏大的情况(图12),BP神经网络模型在物性较差情况下表现更优。如图13下部所示,非取心段X620—X650 m沙三中Ⅱ油组储层物性较差,邻井同油组核磁计算渗透率分布在4~30 mD之间。该套储层的自然伽马值略高于上部储层,中子—密度曲线差异较大,颗粒粒度细;孔隙度整体小于取心段,对应的三孔隙度曲线相较于取心段而言向右偏移;相对低渗透率使得电阻率曲线受侵入影响较小,其不同电阻率曲线差异较小。在多因素制约的条件下,该井通过BP神经网络模型计算效果符合邻井同油组核磁渗透率区间,而孔隙度—粒度模型由于自然伽马曲线计算得到的偏高粒度中值导致计算渗透率偏大。综上所述,多参数输入的BP神经网络模型计算得到的渗透率同时具有精确性,合理性的特点。

图12 神经网络及二元回归模型计算结果分析Fig. 12 Analyses of neural network and binary regression models

图13 垦利油田KL-2井渗透率计算效果图Fig. 13 Permeability calculation results of Well KL-2, KL oilfield

4 结论

储层孔隙度及岩性(粒度)是影响垦利油田沙河街组储层渗透率的主要控制因素。基于主控因素建立的二元回归统计模型和与主控因素相关的测井曲线作为输入(参数)的BP神经网络模型均可用于目标储层渗透率预测和评价。优化后的BP神经网络模型预测结果平均相对误差37%,预测精度比二元回归统计模型提高了26%。

BP神经网络具有训练学习功能,适用于储层渗透率预测和评价。该模型预测精度及可靠性的提高需要考虑网络结构和输入向量的优化。

38个检验样本集(训练样本集40个数据)预测结果误差分析表明,双隐含层、隐含层节点数为10的网络复杂度与本文储层渗透率预测问题复杂度匹配性最好。

因果相关性是BP神经网络输入(参数)优化的关键。包含孔隙度和岩性双重信息的三孔隙度测井曲线、可反映粒度信息的自然伽马相对值曲线以及定性反映储层渗透性的电阻率比值曲线是本研究BP神经网络渗透率预测模型的最优输入(参数)组合,且电阻率比值曲线只需其中一种作为输入即可。自然伽马及电阻率原始测井曲线不宜直接作为模型输入(参数)。

猜你喜欢

垦利渗透率粒度
粉末粒度对纯Re坯显微组织与力学性能的影响
渤海海域垦利6-1油田的发现与浅层勘探思路的重大转变
祝贺《中学时代》杂志社东营市垦利区第一中学记者站成立
中煤阶煤层气井排采阶段划分及渗透率变化
不同渗透率岩芯孔径分布与可动流体研究
SAGD井微压裂储层渗透率变化规律研究
基于粒度矩阵的程度多粒度粗糙集粒度约简
高渗透率风电并网对电力系统失步振荡的影响
泉州湾表层沉积物粒度特征分析
垦利油田群外输登陆海底管道铺设优化