基于模糊C均值聚类与Bayes判别的致密油储层分类评价

2020-12-03康胜松郭粉转

特种油气藏 2020年5期

王伟，康胜松，高峰，郭粉转，张亮

(陕西延长石油(集团)有限责任公司，陕西西安 710075)

0 引言

致密油是继页岩气之后油气勘探开发领域新的热点，目前在世界能源结构中占有极为重要地位[1-3]。中国致密油资源丰富[4-13]，郑志红等[14]采用7种评价方法计算出中国致密油地质资源总量为146.60×108t，可采资源量超过14.55×108t，但由于中国致密油勘探起步较晚，目前仍处于探索阶段[4,6,15]。与北美地区致密油相比，中国致密油受沉积背景影响，储层的非均质强[16-18]，严重制约了致密油的有效动用及高效开发，亟需开展致密储层分类评价，为致密储层压裂选段、优化井位部署等提供地质依据。

众多学者对致密油储层的分类主要从2个方面进行了大量的研究：一方面是在综合分析储层岩石学特征参数的基础上，对致密油储层进行定性划分[19-20]；另一方面是通过岩心渗流实验，依据致密储层的孔喉及渗流特征对其进行分类[21-23]。对于实际应用而言，前者存在分类结果多解性问题，后者则因为常规生产井缺乏实验数据而无法对其进行评价。鉴于此，以鄂尔多斯盆地志丹地区长7致密储层为例，首先采用模糊C均值聚类算法[24-26]，根据取心井的评价参数建立储层的最佳类别，然后利用Bayes判别分析法[27-29]建立不同储层类别与取心井常规测井属性的关系式，基于此关系式预测未取心长7储层的类别，进而明确储层的展布规律，从而为致密储层的高效开发提供依据。

1 算法求解

1.1 模糊C均值聚类算法

模糊C均值(简称FCM)根据研究样本与聚类中心的加权相似程度，对目标函数进行最小化迭代运算，从而确定样本分类[25-26]。假设数据集为x=(x1,x2,…,xn),样本xj与聚类中心Ci的隶属度为uij，则目标函数J及其约束条件为：

(1)

(2)

式中：‖xj-Ci‖2为样本xj与聚类中心Ci的欧式距离；m为模糊化程度，一般取值为2[30]；n为样本

数；c为聚类个数。

在聚类准则式(2)的约束条件下，求取式(1)中J函数的极值，由此，可得隶属度及聚类中心的迭代公式：

(3)

(4)

FCM算法计算步骤为：①设定聚类个数c，模糊化程度m，迭代收敛的精度ε，最大迭代次数Tmax；②用(0,1)间的任一随机数初始化隶属度矩阵U，使其满足式(2)的约束条件；③将U代入式(4)计算聚类中心Ci，并由式(3)更新隶属度矩阵U；④当隶属度变化ΔU<ε或者迭代次数t>Tmax，迭代终止，否则令t=t+1，重复步骤③；⑤计算并输出最优目标函数Jm(U*,C*)，C*为最优聚类中心向量，对应最优分类数为c*，U*为最优分类的隶属度矩阵。

1.2 Bayes判别分析法

Bayes判别的基本思想是利用已知的先验概率分布推断后验概率分布，计算每个样本的后验概率和误判率，然后利用最大后验概率推断样本所属类别并使平均错判损失(ECM)达到最小[25]。假设类别总体为G=(G1,G2,…,Gd)，d为类别个数，x=(x1,x2,…,xu)为一个样品，u为Bayes的属性个数，其属于某一类Gv的概率为qv，即先验概率为q1,q2,…qd。对于给定样品集R的一个划分r=(r1,r2,…,rd)，误判的概率和平均判错损失分别为[18]：

(5)

(6)

式中：pv(x)为样本x属于Gv的后验概率；C(w|v)为样品x来自类别Gv而误判为Gw的损失；P(w|v,r)为误判概率；ECM为平均误判损失。

Bayes算法的判别过程为：①利用已分类的学习样本，按照式(5)构造一个判别函数，分别计算该样品落入d个互斥子域类别的概率；②利用已分类的预测样本，根据式(6)计算样本的ECM，当ECM最小，则得到Bayes判别最优分类。

2 致密油储层分类与判别关系式的建立

2.1 分类属性选取

通过对研究区长7储层69口取心井的调研分析，考虑到属性数据的完整性及获得的难易程度，最终优选出孔隙度(φ)、渗透率(K)、含油饱和度(So)、岩石密度(ρ)、初始月试油的平均日产油量(pD)、含水率(fw)及储层厚度(H)作为FCM聚类的属性参数。其中，孔隙度、渗透率和储层厚度为物性参数，表征致密油储层质量；含油饱和度为含油性参数，反映致密油储层原油富集程度；岩石密度为岩性参数，决定了储层的致密程度；平均日产油量和含水率为生产参数，反映致密油储层的开发效果。

2.2 FCM聚类计算

设定聚类个数为5，模糊化程度为2，迭代收敛的精度为0.000 01，最大迭代次数为100，其中，最优聚类个数根据文献[31]的方法确定。导入69个样本7个属性的矩阵样本，经过63次迭代，目标函数达到收敛精度的要求，各样本的隶属度矩阵值如图1所示，样本在某个类别的隶属度值最大则该样本属于此类。69个样本在日产油及含水率坐标系下的聚类结果如图2所示，5个类别的聚类中心向量属性参数如表1所示。

表1 聚类中心向量属性参数Table 1 Vector attribute parameters of clustering center

图1 隶属度矩阵值分布Fig.1 Value distribution of membership matrix

图2 FCM聚类结果Fig.2 FCM clustering results

根据中国油(气)层工业油流标准[32]及研究区致密储层生产实际情况分析，第I、Ⅱ、Ⅲ类储层日产油均大于0.5 t/d，具有工业开采价值，属于有效储层；第Ⅳ、V类储层日产油小于0.1 t/d，无工业开采价值，属于无效储层。在有效储层中，第I类储层的开发效果最好，判断为油层；第Ⅱ类储层次之，判断为差油层；第Ⅲ类储层日产油较低，含水率较高，判断为油水同层。在无效储层中，第Ⅳ类储层日产油低，含水率高，储层物性、含油性差，岩性致密，判断为水层；第V类储层日产油和含水率很低，储层物性及含油性差，岩性致密，判断为干层。

2.3 Bayes判别属性选取

根据储层的物性、含油性与常规测井曲线之间的相关性，考虑到研究区测井资料的完整程度及实际应用情况，最终优选自然伽马(GR)、自然电位(SP)、声波时差(AC)、深探测感应电阻率(RILD)和泥质含量(Vsh)5个参数作为Bayes判别分析的属性变量。测井曲线均已进行了标准化，其中，泥质含量由自然伽马通过式(7)、(8)求得[14]:

Vsh=2(GCUR·Vsh′-1)/(2GCUR-1)

(7)

Vsh′=(GR-GRmin)/(GRmax-GRmin)

(8)

式中：GRmin、GRmax分别为砂岩和泥岩层的自然伽马值；GCUR是与地层有关的经验系数，文中取值为2.0；Vsh′为归一化GR值的中间变量。

2.4 致密油储层类别与常规测井属性关系的建立

将FCM聚类结果和对应的判别属性数据导入SPSS软件中，检验各组属性变量均值的均等性(表2)，即通过变量的单因素方差分析，寻找关键性的影响变量，分析均值不同变量的差异是否有统计意义，从而了解该变量有无作用。表2中威尔克Lambda统计量是组内平方和与总平方和的比值，F统计量是组间均方与组内均方的比值，自由度1为残差平方和自由度，自由度2为回归平方和自由度，显著性为F检验观测值F0对应的概率，显著性越小表示组间差异越显著。将显著性水平设为0.100。由表2可知，SP没有通过显著性检验，故舍弃该属性。Bayes属性参数确定后，针对每个类别得到一个待解的四元一次方程，将69个样本的聚类结果代入方程组中，根据式(6)使平均误判损失最小即可得到最优的Bayes线性判别函数系数(表3)。由表3结果，得到5类储层的判别函数：

表2 各组平均值的均等性检验Table 2 Equality verification of the average value of each group

表3 Bayes判别函数系数Table 3 Bayes discriminant function coefficient

YⅠ=-0.821GR+7.823AC+1.9RILD-221.693Vsh-857.056

(9)

YⅡ=0.685GR+7.482AC+1.478RILD-401.558Vsh-819.663

(10)

YⅢ=1.156GR+7.408AC+1.271RILD-461.436Vsh-814.313

(11)

YⅣ=1.527GR+7.135AC+1.113RILD-477.105Vsh-775.92

(12)

YⅤ=1.476GR+6.848AC+0.946RILD-403.821Vsh-736.567

(13)

为了验证判别函数的准确性，首先应用样本数据进行自身验证和交叉验证，自身验证通过将样本数据依次代入判别函数来验证函数的准确性，交叉验证通过某类别以外的其他判别函数对其进行验证(表4、5)。由表4可知，自身验证中，第I～V类储层的判别准确度分别为90.9%、90.0%、94.7%、100.0%、75.0%，平均为92.8%，69个样本只有5个判别错误。由表5可知，交互验证中，第I～V类储层判别准确度分别为72.7%、70.0%、89.5%、90.5%、75.0%，平均为82.6%，即69个样本中有12个判别错误。交互验证准确度相对较低的原因是由于第I类和第II类储层在广义概念上都属于油层，其储层“四性”特征及开发方式较为接近，难以区别，但实际应用中二者都属于具有较大开发潜力的储层，故其判断误差对实际的开发决策影响并不大。

表4 自身验证结果Table 4 Self verification results

表5 交叉验证结果Table 5 Cross validation results

3 致密油储层分类评价

3.1 研究区概况

志丹地区位于鄂尔多斯盆地中部，区域构造上位于伊陕斜坡中西部，区内构造平缓，地层倾角为0.5～1.0 °，缺乏大型构造，仅局部发育少量低幅度鼻状隆起。根据沉积旋回及油层纵向分布规律，研究区三叠系延长组自下而上划分为10个油层组，其中，长7段沉积时，盆地处于最大湖泛期，湖盆在长7Ⅰ段和长7Ⅱ段发育多期半深湖—深湖相重力流成因砂体，在长7Ⅲ段则沉积优质的厚层烃源岩。湖盆中心由砂质碎屑流、浊积和滑塌形成的砂岩纵向上源储一体或紧邻，平面上优质烃源岩、致密储集层大面积分布，具有形成致密油的良好地质条件。长7油层组孔隙度为0.9%～20.2%，平均为7.3%，渗透率为0.01～2.51 mD，平均为0.31 mD，属于典型的特低孔、超低渗透致密油藏。

3.2 致密油储层分类评价

根据评价对象的尺度不同，采用2种方法对长7储层砂体进行分类评价：①测点评价。以测井采样点的数据为评价对象，根据判别函数，分别计算各测井采样点的判别函数，并划分到对应类别中。该方法评价的精度高，能分辨砂体内较小尺度的储层类别，缺点是计算量较大、效率较低。②砂体评价。以整个砂体为评价对象，通过统计出砂体平均的判别属性值，代入判别函数中计算，划分储层类别。该方法简单直观，缺点是分辨率低，不能细分储层内较小尺度的类别。

F63-1井为研究区的一口生产井，先后在长7Ⅱ6、长7Ⅰ2段射孔压裂生产。长7Ⅱ的试油平均日产液为10.7 m3/d，不含油，测井一次解释为油水同层，试油结论为水层。长7Ⅰ的试油平均日产液为4.51 m3/d，平均日产油为3.91 t/d，含水率为13.3%，测井一次解释为油水同层，试油结论为油层。通过测点评价，长7Ⅰ射孔砂体I类储层占64.7%，Ⅱ类储层占27.4%，Ⅲ类储层占7.9%，综合评价为I类储层，即油层；通过砂体评价，应用Bayes判别函数计算得到该套砂体YⅠ、YⅡ、YⅢ、YⅣ、YⅤ分别为840、830、748、645、685，I类储层的判别函数值最大，故砂体评价为油层。同理，2种评价方法判断长7Ⅱ射孔砂体为水层(图3)，判别结果均与试油结论一致。