摘要
钻速预测对于优化钻探工艺、降低作业成本、实现科学钻探具有重要意义,它是钻探钻井作业的一项重要内容。基于人工智能的钻速预测精度令人瞩目,但该技术需求的海量数据对传统钻探钻井作业的要求较高。为明确使用人工智能建立钻速预测模型的最少数据量,本文基于中国南海10口井的21917条数据进行了分析。通过相关性分析,所有的输入参数可被划分为高、中、低相关性3大类。通过逐步引入参数建立预测模型和对比预测精度,发现当引入的参数数量足够时,3种相关性参数均可建立起高精度(≥85%)的预测模型。引入参数的相关性越高,建立高精度预测模型需求的参数量越少。通过逐步扩大取样间隔的方式,对比发现所有的预测模型均呈现随取样间隔的增大、预测模型的准确性降低的规律。而预测模型建模的取样间隔下限可通过寻找精度降低时的拐点获得。经过验证,在数据维度与取样精度均为下限时,基于3种相关性参数建立的BP神经网络预测模型仍然能够获得较高的预测精度。
钻探钻井作业是固体矿产与油气资源勘探过程中至关重要的环节。钻速作为评估钻探钻井作业最有效的指标之一,钻速预测对于优化钻探工艺、降低作业成本、实现科学钻探具有重要意义,它是钻探钻井作业的一项重要内容。国内外众多学者对钻速的评估与预测进行了大量的研发。但由于地层与工艺的复杂性,影响钻速的因素繁多,同时相关领域理论体系的不完备性,这些因素之间至今未建立较为令人信服的通用分析模型。各国学者基于不同的现场参数与钻速的关系,先后建立了多种不同的钻速预测模型。
截止目前,常规的钻速预测方案有理论推导型与数据挖掘型两种形式。理论推导型预测方程主要基于钻头结构、受力平衡、机械比能等理论进行推演,如孟英峰
理论推导型模型固然可以获得显著的解析解,但建模过程中为简化边界条件而引入的大量假设条件,无疑为模型的应用带来较大的限制。因此,利用现场监测数据,从中进行挖掘和分析的钻速预测技术近年来备受瞩目。同时得益于近年来机器学习技术的发展,越来越多的钻速预测方式引入人工智能的相关概念(如
在人工智能与大数据产业蓬勃发展的当前,对数据的渴望前所未有。而在钻探钻井行业中,现场作业的多影响因素及条件复杂性无疑对精确模型的需求更高,同时带来对更多数据的采集与分析需求。但值得注意的是,随着对数据采集类型与数据量的激增,对施工作业中的数据采集作业会引起施工成本与难度的增加,过多的数据采集操作也会潜在影响常规钻探钻井施工。当数据采集量超过实际需求量时,原本用以降低成本提高效率的数据采集分析反而将拖累钻探钻井施工,达到事倍功半的效果。因此,钻探钻井数据建模中的数据采集规模与精度的下限判定是避免这种情况产生的必要条件。故本文基于中国南海某片区10口井的相关数据,对通过使用神经网络建立钻速预测方程需求的数据规模下限问题进行了分析与探讨。
本文使用的数据源于中国南海某片区,经过数据采集、整合、清洗、缺失值补充与错误值删除后,获得源自10口井,涵盖包括井眼位置、施工工艺、钻井液性能、地质条件、钻头钻具共5大类44种不同类型的21917条数据生成初始数据集。如
在数据建模分析前,对输入输出数据进行相关性分析是判定建模数据是否有用的必备步骤。本次研究使用Person相关系数计算法,令为变量的Person相关系数,主要计算方法如
(1) |
式中:——变量的协方差矩阵;——变量各自的标准差;——变量数据集中第个变量值;——变量平均值;——变量的数据集大小。
分别计算如

(a) 低相关性参数(相关性系数<0.3)计算结果与分布

(b) 中相关性参数(相关性系数0.3~0.6)计算结果与分布

(c) 高相关性参数(相关性系数>0.6)计算结果与分布
图1 初始数据集相关性计算结果
Fig.1 Correlation calculation results of the initial data set
本文拟采用BP神经网络结合10折交叉验证的数据分组方式完成不同维度与取样精度的模拟分析。因本次研究数据总量较大(21917条),综合考虑建模精度,选用10折交叉验证法进行数据分组。将该初始数据集划分为相斥的10个互斥子集如
(2) |

图2 10折交叉验证基本原理
Fig.2 Basic principle of 10‑fold cross‑validation
钻速预测属于典型的多输入单输出的非线性拟合,因此建模方式选用为在该方面拟合精度非常高的BP神经网络,建立网络结构如

图3 本次研究使用的BP神经网络基本结构
Fig. 3 Basic structure of the BP neural network used in this study
本次研究中BP神经网络建模精度选择以预测输出yi-output与真实值yi-true之间的绝对误差与拟合精度为精度度量,其各自计算方法如
(3) |
式中:yi-output——第个元素BP神经网络的预测输出;yi-true——第个元素真实值;——元素数量。
建模数据维度是指建立钻速预测模型的参数类型数量,而建模数据维度的下限则可被定义为达到足够建模预测精度需求的最少参数数量。对满足精度的建模参数数量下限的研究,可最大程度地降低现场对参数检测需求或后期分析数据需求,避免由于对建模数据量的盲目增长需求而带来的生产与分析成本的急剧上升。结合
基于高、中、低3种不同相关性的参数进行建模数据维度变化的钻速预测建模精度分析,分析结果如

(a) 低相关性参数

(b) 中相关性参数

(c) 高相关性参数
图4 钻速预测模型建模数据维度下限试验结果
Fig.4 Test results of the lower limit of the data
dimension for the ROP prediction model
除跃升阈值以外,还可观察到不同相关性的参数的建模精度随引入数量的提升范围存在上限,低相关性参数在引入15个参数后建模精度达到上限约为92%,中相关性参数在引入13个参数后建模精度达到上限约92 %,高相关性参数在引入11个参数后达到上限约94%。精度上限的存在说明初始数据集中参数包含的信息量存在上限,这也与相关性计算结果中最高相关性未超过0.7相符。
横向对比3种相关性参数组(如
参数间相关性的不同对钻速预测精度的影响则表现为到达指定精度需要的参数数量下限不同。如

图5 不同相关性参数达到需求预测精度的维度下限
Fig.5 Lower limit of the dimension of different correlation parameters for the required accuracy
由维度下限分析可知,当引入数据维度足够多时,即使是低相关参数也可取得较高的预测精度。在此基础上,本研究进一步分析在数据维度保持不变时,维持建模精度所需的数据取样间隔精度下限。对取样精度下限的研究,可减少数据分析时对数据量的需求,提高分析效率,避免对分析数据量的疑惑而引起对分析结论的怀疑。同时,也可降低实际钻探钻井采样时对录井、监测数据的要求。尤其是使用成本较高的随钻测量/测井(MWD/LWD)技术时,对采样精度的降低可提高设备的使用寿命,进一步降低使用成本。本次分析以
高、中、低3种相关性精度下限分析结果如

(a) 低相关参数

(b) 中相关参数

(c) 高相关参数
图6 钻速预测取样精度下限分析结果
Fig.6 Analysis results of the lower limit of sampling accuracy for ROP prediction
结合
结合数据建模维度与精度下限分析结果,分别以10 m的取样精度,以85%的初始精度建立基于低相关性参数(引入9参数)、中相关性参数(引入6参数)、高相关性参数(引入4参数)BP神经网络预测模型,将预测钻速与实测钻速对比如

图7 基于最低维度与取样精度下限的建模预测效果
Fig.7 Prediction results of the model based on the lowest data dimension and sampling accuracy
基于中国南海某片区10口井相关参数的初始数据集(包含井眼位置、施工工艺、钻井液性能、地质条件、钻头钻具5大类44种不同参数共21917条数据),本文根据Person相关系数的定义,计算了43种不同输入参数与实际钻速之间的相关性,并将所有输入参数划分为低相关性参数(含16种参数)、中相关性参数(含15种参数)和高相关性参数(含12种参数)。通过使用BP神经网络,结合10折交叉验证法,分别就低、中、高相关性参数建立了不同的钻速预测方程,并计算了各自的预测误差与预测精度,获得如下结论:
(1)就建模数据维度上看,BP神经网络建模预测的精确度将随引入参数数量的上升而上升。参数的相关性决定了引入参数数量的下限。以工业常用的85%精度为下限,低相关性参数需要引入9个,中、高相关性参数则分别需要引入6个与4个,当精度下限提升到90%,相应的需要引入的低、中、高相关性参数分别提升为12个、10个与9个。
(2)在引入足够的参数后,无论引入参数的相关性高低,都可取得大于90 %的预测精度。但不同参数能够达到的预测精度存在上限,本数据集中低、中、高相关性参数建模精度的上限分别为92%、92%与94%左右。该上限值与引入参数包含的有效信息相关,预测精度达到上限后继续引入参数并不会提高预测精度。
(3)在确定初始预测精度较高(≥85%)的前提下,建模参数取样的精度间隔增大,会引起建模参数数量的降低和其中包含信息的丢失,从而会引起预测精度的下降。通过分别对高、中、低相关性参数组进行建模验证可知,当数据取样间隔超过10 m后会引起建模精度的急剧下降,故本文数据集的钻速预测模型的建模取样精度下限为10 m。
(4)针对不同相关性与初始精度的预测建模对比后发现,参数相关性的降低会增大由于取样间隔增大而导致的建模误差,即使用低相关性参数建立模型需要的取样精度下限应略高于高相关性参数建立模型时的取样要求,以防建模过程中产生的波动。
(5)验证结果表明,在引入足够的参数数量与取样间隔精度后,低相关性、中相关性、高相关性参数均可建立足够准确的BP神经网络钻速预测方程。
参考文献(References)
孟英峰,杨谋,李皋,等.基于机械比能理论的钻井效率随钻评价及优化新方法[J].中国石油大学学报(自然科学版),2012,36(2):110-114. [百度学术]
MENG Yingfeng, YANG Mou, LI Gao, et al. New method of evaluation and optimization of drilling efficiency while drilling based on mechanical specific energy theory[J]. Journal of China University of Petroleum (Edition of Natural Science), 2012,36(2):110-114. [百度学术]
Chen X, Fan H, Guo B, et al. Real‑time prediction and optimization of drilling performance based on a new mechanical specific energy model[J]. Arabian Journal for Science and Engineering, 2014,39(11):8221-8231. [百度学术]
邹德永,王家骏,卢明,等.定向钻井PDC钻头三维钻速预测方法[J].中国石油大学学报(自然科学版),2015,39(5):82-88. [百度学术]
ZOU Deyong, WANG Jiajun, LU Ming, et al. A novel prediction method of PDC bit’s ROP in directional drilling[J]. Journal of China University of Petroleum (Edition of Natural Science), 2015,39(5):82-88. [百度学术]
刘军波,韦红术,赵景芳,等.考虑钻头转速影响的新三维钻速方程[J].石油钻探技术,2015,43(1):52-57. [百度学术]
LIU Junbo, WEI Hongshu, ZHAO Jingfang, et al. A new 3D ROP equation considering the rotary speed of bit[J]. Petroleum Drilling Techniques, 2015,43(1):52-57. [百度学术]
Saksala T, Fourmeau M, Kane P, et al. 3D finite elements modelling of percussive rock drilling: Estimation of rate of penetration based on multiple impact simulations with a commercial drill bit[J]. Computers and Geotechnics, 2018,99:55-63. [百度学术]
Bataee M, Irawan S, Kamyab M. Artificial neural network model for prediction of drilling rate of penetration and optimization of parameters[J]. Journal of the Japan Petroleum Institute, 2014,57(2):65-70. [百度学术]
Hegde C, Daigle H, Millwater H, et al. Analysis of rate of penetration (ROP) prediction in drilling using physics⁃based and data‑driven models[J]. Journal of Petroleum Science and Engineering, 2017,159:295-306. [百度学术]
Hegde C, Gray K E. Use of machine learning and data analytics to increase drilling efficiency for nearby wells[J]. Journal of Natural Gas Science and Engineering, 2017,40:327-335. [百度学术]
Arabjamaloei R, Shadizadeh S R. Modeling and optimizing rate of penetration using intelligent systems in an Iranian southern oil field (Ahwaz Oil Field)[J]. Petroleum Science and Technology, 2011,29:1637-1648. [百度学术]
Yi P, Kumar A, Samuel R. Realtime rate of penetration optimization using the shuffled frog leaping algorithm[J]. Journal of Energy Resources Technology, Transactions of the ASME, 2015,137:32902. [百度学术]
Ansari H R, Sarbaz Hosseini M J, Amirpour M. Drilling rate of penetration prediction through committee support vector regression based on imperialist competitive algorithm[J]. Carbonates and Evaporites, 2017,32(2):205-213. [百度学术]
Eskandarian S, Bahrami P, Kazemi P. A comprehensive data mining approach to estimate the rate of penetration: Application of neural network, rule based models and feature ranking[J]. Journal of Petroleum Science and Engineering, 2017,156:605-615. [百度学术]
Ahmed, Ali, Elkatatny, et al. New artificial neural networks model for predicting rate of penetration in deep shale formation[J]. Sustainability, 2019,11(22):6527. [百度学术]
Gan C, Cao W, Wu M, et al. Prediction of drilling rate of penetration (ROP) using hybrid support vector regression: A case study on the Shennongjia area, Central China[J]. Journal of Petroleum Science and Engineering, 2019,181:106200. [百度学术]
Bhatnagar A, Khandelwal M. An intelligent approach to evaluate drilling performance[J]. Neural Computing and Applications, 2012,21(4):763-770. [百度学术]
Moraveji M Keshavarz, Naderi M. Drilling rate of penetration prediction and optimization using response surface methodology and bat algorithm[J]. Journal of Natural Gas Science and Engineering, 2016,31:829-841. [百度学术]
Al‑Abduljabbar A, Elkatatny S, Mahmoud M, et al. A robust rate of penetration model for carbonate formation[J]. Journal of Energy Resources Technology, 2018,141(4). [百度学术]
Elkatatny S. Development of a new rate of penetration model using self‑adaptive differential evolution‑artificial neural network[J]. Arabian Journal of Geosciences, 2019,12(2). [百度学术]