摘要
在钻井作业中发生的井漏事故具有突发性、难治理等特点,导致现场堵漏工程难度大、成功率低、成本高等。为了“快、准、狠”地解决该类难题,必须准确预测漏失并提出堵漏措施。本文利用梯度提升决策树算法(GBDT)进行了井漏预测模型研究,通过分析若干机器学习算法,论证了GBDT作为井漏钻前预测模型的可行性;利用案例推理技术建立井漏案例诊断库,使用欧几里得算法和LB_Keogh算法进行井漏案例的检索,提出相应的井漏处理措施,通过实例验证了相似性计算的可靠性。
井漏是指相当一部分或者全部钻井液从井筒损失进入到具有高渗透率的地层中,比如洞穴、裂缝或者松散地层。国外较为成熟的井漏预测与诊断的技术有精细控压钻井技术、ALS-K井涌井漏快速探测系统、DrillEdge软
梯度提升决策树算法(GBDT,Gradient Boosted Decision Tree),是一种集成学习算法,该算法通过建立一个决策树,以适应它前面的树的残差,就像其他提升算法一样,GBDT算法是一种迭代过程,可以将几个弱的“学习器”组合成一个强的“学习器”,提高预测的准确性。同时,其对原始数据处理要求低,能够有效应对复杂的工程问
综上所述,本文旨在研究GBDT在井漏预测与诊断中的应用,通过井漏机理分析,选取地层参数和钻井工程参数,分析GBDT作为井漏钻前诊断模型的可行性;利用案例推理技术建立井漏案例诊断库,使用欧几里得算法和LB_Keogh算法进行井漏案例的检索,提出相应的井漏处理措施,通过实例计算得出相似性计算的可靠性。
井漏的发生受到地质、工程等多种原因影响,也会通过地面监测仪器参数表现出来,因此,在使用GBDT算法对井漏进行预测时,应将这些原因考虑进去,提高预测精度。
在钻井设计时,考虑地层分层及其特征并进行故障提示是非常有必要的,比如碳酸盐岩地层裂缝、孔洞发育;粗砂、砾石地层渗透率高;页岩具有弱平面的特点,在钻井作业中容易被压裂形成漏失通道。所以地层岩性、孔隙度和渗透率需要参与到井漏诊断的计算中。
钻井液密度对井漏的影响主要是由于密度升高,增大了液柱压力,从而增大了井内与地层之间的压差。粘度较大时,对防止井漏或减轻井漏是有益的。但是在实际钻井过程中,过大的粘度将会使得循环压力过高,从而使薄弱地层产生人为裂缝 ,引起更大的漏
漏失通道的尺寸应大于钻井液固相颗粒粒径,否则固相颗粒过大会在井壁形成泥饼,而固相颗粒过小,则会导致井筒内钻井液的漏
GBDT使用回归树模型作为弱学习器,通过多次迭代,每次迭代产生一个弱学习器,每个学习器在上一轮学习器的梯度基础上进行训练,即让损失函数沿着梯度方向下降,使当前迭代轮次的损失函数最小。当迭代完成后,就可以得到最终的强学习器,实现预测的目的。在构建井漏预测模型的过程中,需要对模型进行数据训练来提高模型的精度。
在进行数据训练之前首先对数据进行预处理,剔除由人为因素或外界因素干扰造成的异常数据,对含有缺失值的数据进行忽略,并将数值进行归一化,从而避免特征量纲差异对预测结果造成的影响。本研究选用最大最小化方法将特征归一到[0,1]之间:
(1) |
式中:——归一化后特征;、——分别为特征的最大值和最小值。
需要进行处理的数据分为2类,一类是数值型数据,一类是文字型数据。数值型数据需要统一格式再进行处理,采用能够代表井漏特征的参数进行表示,其中使用马氏漏斗粘度来表示钻井液粘度,其中马氏漏斗粘度通过流出一定体积的钻井液所经历的时间来衡量粘度大小;用颗粒级配中的中值粒径D50来表示固相颗粒的大小程度,其中D50表示颗粒累积分布百分数达到50%时所对应的粒径值;文字型数据需要进行量化,使文字数据转化为数值数据。在井漏特征参数中只有地层岩性是文字型数据,将其进行量化的处理方法是按照0~100的顺序逻辑对特征属性的所有取值赋予一个对应的正整数,方便后续计算。
案例推理既是一种人工智能技术,又是利用相似案例的相关信息解决当前问题的类比推理方
案例检索的相似度计算是诊断模型的核
诊断模型需要不断加入新案例进行自主学
在井漏诊断中,本研究利用层析分析法中的标度法,对井漏参数构建判断矩阵,其中各标度值见
建立判断矩阵:
(7) |
式中:——判断矩阵中第个特征参数相对于第个特征参数的重要判断标度值。
由
(8) |
为了确保最终计算结果的准确性,需要进一步构建最优传递矩阵,如果判断矩阵满足下式,则判断矩阵为一致性矩阵:
(9) |
构建一致性矩阵:
(10) |
通过计算一致性矩阵每行元素的乘积:
(11) |
最终通过计算每个乘积的n次方根,并对结果做归一化处理得到每个特征参数的权重值,最后计算结果见
(12) |
(13) |
式中:——特征参数的个数。

图1 层次分析法权重求取结果
Fig.1 AHP weighting results
为确保各特征参数之间重要程度之间的协调性,需要对举证做一致性检验,即可靠性论证,以免出现参数A比参数B重要,参数B比参数C重要,但参数C比参数A重要的矛盾。一致性指标见
(14) |
式中:——致性指标;——致性系数;——平均随机一致性指标。
其中平均随机一致性指标与矩阵阶数有关,具体数值见
矩阵中最大特征根,满足矩阵一致性要求。
本研究选用欧几里得距离法来计算属于非时间序列的井漏特征参数。下面结合2个案例具体研究如何使用欧几里得法计算井漏案例在特征参数上的相似
设A井漏案例中的所有非时间序列参数的取值组成的集合为:
(15) |
设B井漏案例中的所有非时间序列参数的取值组成的集合为:
(16) |
式中:——2个井漏案例的第个特征属性的取值;——井漏案例的非时间序列参数的总个数。
计算相似度之前,需要将钻井作业中采集到的数据进行预处理,消除数据量纲或数据数值过大对计算造成的不良影响。以地层压力为例,本文利用归一化算法和欧几里得法计算2个井漏案例在钻井液密度上的相似度,见
(17) |
式中:max——地层压力特征属性的最大取值;min——地层压力特征属性的最小取值
在计算2个案例某一特征的相似度之后,要计算2个案例的所有特征的相似度,并且根据层次分析法求取的每个特征参数的权重进行求和,计算出2个案例的整体相似度,见
(18) |
式中:——井漏案例在所有特征参数上的相似度;——第个特征参数所具有的权重;——井漏案例在第个特征参数上的相似度。
本研究采用动态弯曲算法中的LB_Keogh算
(19) |
(20) |
式中:r≥1。
对于任意的U、L和Q都满足下式:
(21) |
定义了U和L之后,使用它们来定义一个下界度量:
(22) |
则时间序列Q和C之间的相似度为:
(23) |
2个案例之间的相似度为所有井漏特征参数乘以权重再求和,见
(24) |
以同在珍珠冲层位发生小漏的川6B1和川6B1井为例,以钻井液池总体积特征参数为例说明此时间序列检索模型的应用。川6B1和川6B2井发生井漏时钻井液池总体积参数数据及其归一化计算见
定义川6B1井的归一化数据为时间序列Q,川6B2井的归一化数据为时间序列C。则根据上述公式得:
(25) |
(26) |
(27) |
(28) |
由于发生井漏的2口井漏案例为同一区块且位于同一层位的2个案例,因此在钻井液池总体积参数上的相似度很大,其他参数的相似度计算与上文计算步骤类似,再此不一一赘述。通过此实例说明LB_Keogh算法在对时间序列相似度求取上的可靠性。
(1)本文通过分析,论证了梯度提升决策树算法在预测模型上的可行性,采用案例推理方法建立了井漏诊断模型,在预测出新井某一深度的漏失情况后,可使用诊断模型计算相似度,快速检索与新井最相似的案例井,现场工作人员可参考案例井的防漏堵漏措施,提前准备处理方案。
(2)在井漏诊断模型中,使用层次分析法确定井漏特征参数权重,使用欧几里得距离法和LB_ Keogh动态弯曲算法对案例相似度进行计算,并验证了相似度算法的可靠性。
参考文献(References)
Kulikov S, Veliev G, Bakhtin A, et al. “Secure Drilling” services for safe and effective drilling[C]//SPE Arctic and Extreme Environments Technical Conference and Exhibition, 2013. [百度学术]
Raja H, Sørmo F, Vinther M L. Case‑based reasoning: Predicting real‑time drilling problems and improving drilling performance[C]//SPE Middle East Oil and Gas Show and Conference, 2011. [百度学术]
贾爱贵.ALS-K井涌井漏快速探测系统[J].录井技术,1998(2):48-52. [百度学术]
JIA Aigui. AlS‑K kick and lost circulation fast detection system[J]. Mud Logging Engineering, 1998(2): 48-52. [百度学术]
姜永,白生平,赵书滨,等.综合录井技术在钻井工程上的应用[J].石油钻采工艺,2009,31(S2): 79-82. [百度学术]
JIANG Yong, BAI Shengping, ZHAO Shubin, et al. Application of compound logging technology in drilling engineering[J]. Oil Drilling & Production Technology, 2009,31(S2):79-82. [百度学术]
李治伟.塔里木井控装备配套技术研究[D].成都:西南石油大学,2011. [百度学术]
LI Zhiwei. Study on matching technology of well control equipment in Tarim[D]. Chengdu: Southwest Petroleum University, 2011. [百度学术]
苟开海,胡泽,葛亮.基于DSP的井底微流量测量系统设计[J].计量与测试技术,2011,38(9):17-19. [百度学术]
GOU Kaihai, HU Ze, GE Liang. Design of detective instrument for tiny flow of well based on DSP[J]. Metrology & Measurement Technique, 2011,38(9):17-19. [百度学术]
屈俊波,陈平,马天寿,等.精确监测井底溢流的井下微流量装置设计与试验[J].石油钻探技术,2012,40(5):106-110. [百度学术]
QU Junbo, CHEN Ping, MA Tianshou, et al. Design and test of down‑hole micro‑flow device for monitoring overflow[J]. Petroleum Drilling Techniques, 2012,40(5):106-110. [百度学术]
王海彪.井漏智能识别及处理决策研究[D].成都:西南石油大学,2017. [百度学术]
WANG Haibiao. Study of intelligent recognition and management decisions of lost circulation[D]. Chengdu: Southwest Petroleum University, 2017. [百度学术]
李雪松,张骁,管震,等.基于图像识别技术的钻井井漏溢流智能报警系统开发[J].世界石油工业,2021,28(1):48-54. [百度学术]
LI Xuesong, ZHANG Xiao, GUAN Zhen, et al. Development of the drilling mud loss and overflow intelligent alarm system based on the image recognition technology[J]. World Petroleum Industry, 2021,28(1):48-54. [百度学术]
和鹏飞,刘晓宾,陈真,等.基于深度神经网络模型的钻井井漏预测研究[J].天津科技,2019,46(S1):21-23. [百度学术]
HE Pengfei, LIU Xiaobin, CHEN Zhen, et al. Research on prediction of lost circulation based on deep neural network model[J]. Tianjin Science & Technology, 2019,46(S1):21-23. [百度学术]
谢平,蒋丽雯,赵尧,等.基于神经网络的井涌井漏实时预测方法研究[J].现代计算机(专业版),2018(11):23-28. [百度学术]
XIE Ping, JIANG Liwen, ZHAO Yao, et al. Research on real‑time prediction and analysis based on neural network for well kick and lost circulation[J]. Modern Computer, 2018(11):23-28. [百度学术]
李克智,袁本福.红河油田井漏风险实时识别研究与应用[J]. 钻采工艺,2013,36(4):20-22,134. [百度学术]
LI Kezhi, YUAN Benfu. Research and application on circulation loss risk real‑time identification in Honghe Oilfield[J]. Drilling & Production Technology, 2013,36(4):20-22,134. [百度学术]
徐哲,李建,王兵,等.基于贝叶斯网络的钻井井漏问题研究[J].石油天然气学报,2013,35(12):125-129,8-9. [百度学术]
XU Zhe, LI Jian, WANG Bing, et al. Research on well leakage in drilling based on Bayesian network[J]. Journal of Oil and Gas Technology, 2013,35(12):125-129,8-9. [百度学术]
张正,赖旭芝,陆承达,等.基于贝叶斯网络的钻进过程井漏井涌事故预警[J].探矿工程(岩土钻掘工程),2020,47(4):114-121,144. [百度学术]
ZHANG Zheng, LAI Xuzhi, LU Chengda, et al. Lost circulation and kick accidents warning based on Bayesian network for the drilling process[J]. Exploration Engineering (Rock & Soil Drilling and Tunneling), 2020,47(4):114-121,144. [百度学术]
李晓桐,徐英卓,何坤鹏,等.钻井异常智能预警系统研究[J]. 福建电脑,2013,29(4):1-3. [百度学术]
LI Xiaotong, XU Yingzhuo, HE Kunpeng, et al. Research on intelligent early warning system of drilling anomaly[J]. Fujian Computer, 2013,29(4):1-3. [百度学术]
刘彪,李窚晓,李双贵,等.基于支持向量回归的井漏预测[J]. 钻采工艺,2019,42(6):17-20,1-2. [百度学术]
LIU Biao, LI Chenxiao, LI Shuanggui, et al. Lost circulation prediction based on support vector regression[J]. Drilling & Production Technology, 2019,42(6):17-20,1-2. [百度学术]
谷宇峰,张道勇,鲍志东,等.利用梯度提升决策树(GBDT)预测渗透率——以姬塬油田西部长4+5段致密砂岩储层为例[J].地球物理学进展,2021,36(2):585-594. [百度学术]
GU Yufeng, ZHANG Daoyong, BAO ZhiDong, et al. Permeability prediction using gradient boosting decision tree(GBDT): A case study of tight sandstone reservoirs of member of Chang 4+5 in western Jiyuan Oilfield[J]. Progress in Geophysics, 2021,36(2):585-594. [百度学术]
韩启迪,张小桐,申维.基于梯度提升决策树(GBDT)算法的岩性识别技术[J].矿物岩石地球化学通报,2018,37(6): 1173-1180. [百度学术]
HAN Qidi, ZHANG Xiaotong, SHEN Wei. Lithology identification technology based on gradient boosting decision tree (GBDT)algorithm[J]. Bulletin of Mineralogy Petrology and Geochemistry, 2018,37(6):1173-1180. [百度学术]
石运良,罗宇,陈正科.基于GBDT算法的焊缝背面熔宽预测[J].热加工工艺,2021,50(17):110-114. [百度学术]
SHI Yunliang, LUO Yu, CHEN Zhengke. Prediction of weld backside molten pool width based on GBDT algorithm[J]. Hot Working Technology, 2021,50(17):110-114. [百度学术]
贾南,何昌原,段海鹏.基于集成算法的森林火灾风险预警模型研究[J].武警学院学报,2021,37(12):5-9. [百度学术]
JIA Nan, HE Changyuan, DUAN Haipeng. Research on fire risk early warning model based on integrated algorithm[J]. Journal of Chinese People’s Armed Police Force Academy, 2021,37(12):5-9. [百度学术]
徐安.基于机器学习的慢性疾病预测关键技术研究[D].成都:电子科技大学, 2019. [百度学术]
XU An. Research of chronic disease prediction technology based on machine learning[D]. Chengdu: School of Computer Science and Engineering, 2019. [百度学术]
龚谊承,都承华,张艳娜,等.基于主成分和GBDT对血糖值的预测[J].数学的实践与认识,2019,49(14):116-122. [百度学术]
GONG Yicheng, DU Chenghua, ZHANG Yanna, et al. Prediction of blood glucose based on principal componnent and GBDT[J]. Mathematics in Practice and Theory, 2019,49(14): 116-122. [百度学术]
黄沼沣,薛旺星,蔡铭,等.基于梯度提升算法的道路交通噪声预测模型研究[J].环境科学与技术,2020,43(4):46-53. [百度学术]
HUANG Zhaofeng, XUE Wangxing, CAI Ming, et al. A traffic noise prediction model based on gradient boosting algorithm [J]. Environmental Science & Technology, 2020,43(4): 46-53. [百度学术]
翁剑成,付宇,林鹏飞,等.基于梯度推进决策树的日维度交通指数预测模型[J].交通运输系统工程与信息,2019,19(2): 80-85,93. [百度学术]
WENG Jiancheng, FU Yu, LIN Pengfei, et al. GBDT method based on prediction model of daily dimension traffic index[J]. Journal of Transportation Systems Engineering and Information Technology, 2019,19(2):80-85,93. [百度学术]
廖璐,张亚东,葛晓程,等.基于GBDT的列车晚点时长预测模型研究[J].铁道标准设计,2021,65(8):149-154,176. [百度学术]
LIAO Lu, ZHANG Yadong, GE Xiaocheng, et al. Research on prediction model of train delay time based on GBDT[J]. Railway Standard Design, 2021,65(8):149-154,176. [百度学术]
陈宏,邓芳明,吴翔,等.基于梯度提升决策树的电力电子电路故障诊断[J].测控技术,2017,36(5):9-12,20. [百度学术]
CHEN Hong, DENG Fangming, WU Xiang, et al. Fault diagnosis of power electronics circuit based on gradient boosting decision tree[J]. Measurement & Control Technology, 2017,36(5):9-12,20. [百度学术]
刘金硕,刘必为,张密,等.基于GBDT的电力计量设备故障预测[J].计算机科学,2019,46(S1):392-396. [百度学术]
LIU Jinshuo, LIU Biwei, ZHANG Mi, et al. Fault prediction of power metering equipment based on GBDT[J]. Computer Science, 2019,46(S1):392-396. [百度学术]
苏兴华,孙俊明,高翔,等.基于GBDT算法的钻井机械钻速预测方法研究[J].计算机应用与软件,2019,36(12):87-92. [百度学术]
SU Xinghua, SUN Junming, GAO Xiang, et al. Prediction methon of drilling rate of penetration based on GBDT algorithm[J]. Computer Applications and Software, 2019,36(12): 87-92. [百度学术]
杜青才.准噶尔南缘复杂构造地质力学分析与井下复杂机理研究[D].成都:西南石油学院,2004. [百度学术]
DU Qingcai. Geomechanical analysis of complex structures in the southern margin of Zhunger basin and study on underground complex mechanism[D]. Chengdu: Southwest Petroleum University, 2004. [百度学术]
金衍,卢运虎,李再均.一种井漏层位钻前风险预测新方法[J].石油钻采工艺,2008(3):24-28. [百度学术]
JIN Yan, LU Yunhu, LI Zaijun. A new method predicting pre‑drilling risk in lost circulation formation[J]. Oil Drilling & Production, 2008(3):24-28. [百度学术]
胡莎莎.压力衰竭地层井漏预测技术研究[D].东营:中国石油大学(华东),2013. [百度学术]
HU Shasha. The prediction of lost circulation technology research in pressure depleted formation[D]. Dongying: China University of Petroleum (East China), 2013. [百度学术]
刘寿军.钻井液液面监测与自动灌浆装置的研制[J].石油机械,2006(2):29-30,78. [百度学术]
LIU Shoujun. Development of device for drilling fluid level detection and automatic grout system[J]. China Petroleum Machinery, 2006(2):29-30,78. [百度学术]
Denhiere G. Dynamic memory, a theory of reminding and learning in computers and people‑schank, RC[J]. Annee Psychologique, 1985,85(4):607-608. [百度学术]
张学洪,李黔.基于案例推理的井漏风险预警方法[J].断块油气田,2017,24(2):255-258,263. [百度学术]
ZHANG Xuehong, LI Qian. Risk pre‑warning method of well leakage based on case reasonin[J]. Fault‑Block Oil & Gas Field, 2017,24(2):255-258,263. [百度学术]
谷淑娟,高学东,孙冉.一种改进的CBR案例检索相似性度量模型[J].中国管理信息化,2011,14(9):50-55. [百度学术]
GU Shujuan, GAO Xuedong, SUN Ran. An improved case similarity measure for case retrieval in CBR based on emergency decision[J]. China Management Informationization, 2011, 14(9):50-55. [百度学术]
郭双双.基于模型算法的网络艺术考级研究分析[D].杭州:浙江大学,2018. [百度学术]
GUO Shuangshuang. Research and analysis of network art grading based on model and algorithm[D]. Hangzhou: Zhejiang University, 2018. [百度学术]
Bassily H. A comparative fault diagnosis methodology based on time series analysis of system’s signals[D]. Clemson: Clemson University, 2007. [百度学术]