摘要
地质导向是当前钻探智能化的核心组成部分,但当前地质导向中关键的地层识别还缺乏算法模型支撑。本文采用深度学习算法,基于四川威远区块实际采集的井身轨迹参数数据、测井数据,建立了能够实时预测钻遇地层的算法体系。该体系首先通过时序预测算法完成对后续井身轨迹的预测,其次基于该预测值实现对地层伽马值的预测,最后根据地层伽马值完成对钻遇地层的类型识别。为提高整个算法体系预测准确性,各环节采用多种算法进行对比,结果证明采用循环神经网络训练的实时预测,随机森林预测伽马值回归,支持向量机预测地层分类的训练效果最好,预测和识别精度分别达到了0.81、0.83、81.8%。地质导向过程中对实时钻遇地层的预判,为现场提供数据支撑以及辅助判断的手段,帮助实际工程更可靠有效地实现地质目标。
在钻井作业中,地质导向通过控制井身轨迹,以达到实际作业区域并满足实际工程指
许多专家学者已经在智能化导向钻井方面取得了不少成果。Qin
地质导向需要从实时数据中推断,然而随钻数据却提供滞后的储层信息,并运用于之后的地质导向决策判
本文所用的原始数据集采集于威远地区页岩气田6口井。具体的6口井井号,以及采集数据如
井号 | Z201、Z202、Z203、Z204、W202、 W204 |
---|---|
井斜轨迹参数 | MD(斜深)、TVD(垂深)、INCL(井斜角)、AZIM(方位角)、X(大地坐标)、Y(大地坐标) |
测井参数 | GR(伽马值)、DEP (深度)、地层分层 |
该地区的产层主要为五峰—龙马溪组。五峰组顶界主要为观音桥段介壳灰岩,厚度在1 m以内,之后为五峰组碳质硅质页岩。龙马溪组自上而下划分为龙二段与龙一段。龙一段又划分龙一2亚段与龙一1亚段。龙一1亚段特征集中表现为黑色碳质、硅质的页岩。当前钻井区域目的层为龙一1亚段中的4个小层。由新到旧依次为龙一

图1 地层分布
具体建模流程如

图2 模型工作示意
常见算法中的学习器包括分类器与回归器,回归器在连续样本值点建模的应用广泛,与分类器不同,回归器不需要提前进行人为分类,其模型的输入输出是具体的数值,而非标签类别。本文拟建模的伽马值预测就需要回归器得以实现。与地层类别参数不同,实际采得的伽马值为具体的数值,无法进行标签一一对应。采用回归器对伽马值进行预测回归,旨在通过对误差的衡量来寻求伽马值与其他输入参数变量之间的一种关系。通过回归器训练,可以输出预测的伽马值。
回归器常使用回归算法建模,评价模型的指标通常使用均方根误差(MSE)或
(1) |
(2) |
式中:yi——观测值;——观测值的平均值;——回归模型第i个的观测值;n——样本数量。
分类器的职责旨在根据输入数据进行标签化划分,同时输出结果为类别的标签。这也就意味着在输入数据时,需要人为根据数据特点进行分类,并给与对应的标签类别。本文拟建模的地层分类预测模型,很好的对应分类器的特点。将实际采集到的地层具体分类信息,打上与之对应的数字标签,输入到分类器算法中进行学习建模,分类器可以在学习的过程中对地层分类的标签进行识别训练并输出预测结果。
分类器通常使用的是分类算法,评价分类器的模型常使用准确率(Accuracy)来表示,具体公式如下:
(3) |
式中:Accuracy——准确率;TP——分类结果中正确样本的数量;N——所有的样本。
早先已有数据科学家明确指出,不存在一种万能算法适用于解决所有难题。因此,在实际解决问题时,需要根据实际问题类型,变量的数量,来选取合适的算法以解决问
支持向量机(SVM)是一种简单、高效的监督算法,可用于解决分类与回归建
神经网络是深度学习中常见的算法,其功能强大,在多个领域得到广泛运用,比如信号处理、特征保留
随机森林(RF)是目前运用最广泛的学习器之
这3种常见的机器学习算法具备同时处理回归预测与分类预测的能力,但仍有一些常用的算法在单一的分类与回归预测中表现不俗。比如梯度回归算法、决策树分类算法、KNN分类算法。
决策树分类是单一的分类易受噪音影响适用于较小的数据集,决策树分类的核心思想是在数据特征空间中创建一棵树,其中每个内部节点表示一个特征条件,每个叶子节点代表一个类别。而随机森林分类是集成分类器,集成多个决策树进行分类。用单一的决策树分类根据结果可以预先了解模型的准确性下限,以及判断数据集中数据量的量级。为后面集成学习提高模型精确度有一定辅助作用。
梯度回归算法是一种迭代优化算法,通过迭代优化过程,逐步调整模型参数,以使损失函数逐渐减小。该过程通过计算损失函数关于模型参数的梯度,朝着梯度下降进行参数优化。使预测结果更接近实际观测值。
KNN分类是一种有监督分类算法,通过给定一个未标记的数据点,根据其与已知标记数据点之间的距离,将其分类为与其最近的K个已知标记数据点中占比最多的类别。KNN分类的关键在于K值的选取。较小较大的K值都会带来决策的边界模糊,通过引入轮廓系数对比,可以在实际运用中选取合适的K值。
在本文建模过程中3类算法的选择具体如
建模模型 | 算 法 |
---|---|
时序预测模型 | RNN神经网络 |
伽马值回归预测模型 | 随机森林回归 |
梯度回归 | |
支持向量机回归 | |
ANN神经网络 | |
地层分类预测模型 | 决策树分类 |
随机森林分类 | |
支持向量机分类 | |
KNN分类 |
在地质导向过程中,实时预测对于保持储层最大接触率、控制井眼轨迹、确保储层遇钻率等有着重要的意义。建立时间序列与预测参数对应的模型,将井身轨迹参数作为输入,结合特定的时序预测算法,可输出同时间点未来若干时间步数的井身轨迹参数。通常,模型的准确率与数据集自身特点有关,意味着数据集的样本点越多,预测的效果越好。随着钻进的进行,新采集的数据可以不断加入已经训练好的数据,并进一步用于预测该时间点后的未来时间步的轨迹参数。模型的精确度会越来越高。具体建立井身轨迹参数预测模型如

图3 井身轨迹参数预测模型工作示意
在时序预测中,循环神经网络(RNN)是一种十分常见的学习算法。如

图4 井斜参数预测模型的MSE的迭代次数
评价模型的好坏不能单一参考MSE值,也要根据实际与预测的对比。从测试集上得到训练结果

(a) MD对比

(b) X值对比

(c) Y值对比
图5 测试集随机选取真实值预测值对比
本文已经建立了时间序列与未来井身轨迹参数的预测模型,而对未来深度对应的伽马值进行预测,属于回归预测。而井身轨迹参数、深度、伽马值是互相对应的,具体如

图6 伽马值模型输入输出参数
参数 | MD | X | Y | TVD | AZIM | INCL |
---|---|---|---|---|---|---|
MD | 1 | 0.039424 | 0.171330 | 0.999999 | 0.281378 | 0.319773 |
X | 0.039424 | 1 | -0.147518 | 0.039713 | 0.350433 | -0.292032 |
Y | 0.171330 | -0.147518 | 1 | 0.171347 | 0.156450 | 0.045038 |
TVD | 0.999999 | 0.039713 | 0.171347 | 1 | 0.281495 | 0.318880 |
AZIM | 0.281378 | 0.350433 | 0.281495 | 0.281495 | 1 | 0.121834 |
INCL | 0.319773 | -0.292032 | 0.318880 | 0.318880 | 0.121834 | 1 |
本文将井身轨迹参数作为输入,伽马值作为预测变量进行建模。如

图7 4不同算法伽马值回归模型
模型训练效果如

图8 4不同算法模型训练效果
最后,根据伽马值与其对应的地层分类,将伽马值作为输入参数,地层分类作为输出建立模型,将地层分类情况打上标签。
如

图9 4分类器训练模型准确率
分类标签 | 随机森林 | 支持向量机 | ||||||||
---|---|---|---|---|---|---|---|---|---|---|
五峰组(0) | 43 | 0 | 0 | 0 | 1 | 42 | 1 | 0 | 0 | 1 |
龙一 | 0 | 14 | 4 | 1 | 2 | 0 | 19 | 1 | 0 | 1 |
龙一 | 0 | 3 | 4 | 6 | 20 | 0 | 2 | 5 | 10 | 16 |
龙一 | 0 | 5 | 3 | 4 | 19 | 0 | 2 | 4 | 9 | 16 |
龙一 | 0 | 0 | 0 | 1 | 158 | 1 | 0 | 0 | 0 | 158 |
威远地区辅助地质导向建模推荐流程如下:
首先借助RNN神经网络训练并建立实时井身轨迹参数预测模型,输入实时的井身轨迹参数,得到未来井身轨迹参数,该模型的精确度MSE指标可达到0.00025,
然后运用随机森林回归器训练并建立伽马值预测模型,该模型输入井斜参数数据,可得到预测的伽马值,随机森林模型的
最后运用支持向量机分类器建立地层预测参数模型,输入伽马值得到预测的地层分类。
该模型的准确度达到了81.8%,在目的层龙一

图10 建模推荐使用流程
(1)基于威远地区钻井的数据,实现了基于时序的井身轨迹参数预测、测井伽马值预测与地层预测的模型建立。确定了从井身轨迹—伽马值—地层分类,依次对应的预测模型建立流程。
(2)分别选取了各自模型结果最好的算法,分别是采用RNN循环神经网络的井身轨迹参数预测模型,
参考文献(References)
Jin Y, Wan Q, Wu X, et al. FPGA-accelerated deep neural network for real‑time inversion of geosteering data[J]. Geoenergy Science and Engineering, 2023,224:211610. [百度学术]
Mohamed D, Jeremy C. Unconventional horizontal well placement challenges-LWD geosteering applications utilizing a unique spectral azimuthal gamma ray in real time[Z]. 2014. [百度学术]
Thwaites N, Suh A. Use of near bit azimuthal gamma ray and inclination tool improves geosteering in CBM wells, Airth Field, Scotland[Z]. EAGE Publications BV, 20141-12. [百度学术]
Qin Z, Pan H, Wang Z, et al. A fast forward algorithm for real‑time geosteering of azimuthal gamma‑ray logging[J]. Applied Radiation and Isotopes, 2017,123:114-120. [百度学术]
Moorkamp M, Lelièvre P G, Linde N, et al. Integrated Imaging of the Earth: Theory and Applications[M]. John Wiley & Sons, 2016. [百度学术]
Sun Q, Duan Y, Yan Y, et al. Forward Algorithm of LWD Azimuthal Gamma[J]. Journal of System Simulation, 2018,30(11):4268. [百度学术]
Qin Z, Tang B, Wu D, et al. A qualitative characteristic scheme and a fast distance prediction method of multi‑probe azimuthal gamma‑ray logging in geosteering[J]. Journal of Petroleum Science and Engineering, 2021,199:108244. [百度学术]
Lu H, Shen Q, Chen J, et al. Parallel multiple‑chain DRAM MCMC for large‑scale geosteering inversion and uncertainty quantification[J]. Journal of Petroleum Science and Engineering, 2019,174:189-200. [百度学术]
Kullawan K, Bratvold R B, Bickel J E. Sequential geosteering decisions for optimization of real‑time well placement[J]. Journal of Petroleum Science and Engineering, 2018,165:90-104. [百度学术]
Zong C, Liu J, Liu Z, et al. A fast forward algorithm of azimuthal gamma imaging logging while drilling[J]. Applied Radiation and Isotopes, 2023,194:110659. [百度学术]
Dawoud A, El Mahdi A, Ayoub M, et al. Geosteering long horizontal holes in Abu Dhabi heterogeneous carbonate reservoirs[Z]. 2010128851. [百度学术]
Mahesh B. Machine learning algorithms—A review[J]. International Journal of Science and Research (IJSR) (Internet), 2020,9:381-386. [百度学术]
奉国和.SVM分类核函数及参数选择比较[J].计算机工程与应用,2011,47(3):123-124. [百度学术]
G E Ron A E L. Hands‑on Machine Learning with Scikit-Learn, Keras, and TensorFlow[M]. O’Reilly Media, Inc., 2022. [百度学术]
Altin F G, Budak 0, özcan F. Predicting the amount of medical waste using kernel‑based SVM and deep learning methods for a private hospital in Turkey[J]. Sustainable Chemistry and Pharmacy, 2023,33:101060. [百度学术]
Raghavendra. N S, Deka P C. Support vector machine applications in the field of hydrology: A review[J]. Applied Soft Computing, 2014,19:372-386. [百度学术]
Hamad A, Houssein E H, Hassanien A E, et al. A hybrid EEG signals classification approach based on grey wolf optimizer enhanced SVMs for epileptic detection[C]//Cham: Springer International Publishing, 2018. [百度学术]
Houssein E H, Hamad A, Hassanien A E, et al. Epileptic detection based on whale optimization enhanced support vector machine[J]. Journal of Information and Optimization Sciences, 2019,40(3):699-723. [百度学术]
Tang W, Gong Y, Qiu G. Feature preserving 3D mesh denoising with a Dense Local Graph Neural Network[J]. Computer Vision and Image Understanding, 2023,233:103710. [百度学术]
胡中源,薛羽,查加杰.演化循环神经网络研究综述[J].计算机科学,2023,50(3):254-265. [百度学术]
Qian K, Tian L. An embedded Hamiltonian dynamic evolutionary neural network model for high-dimensional data recognition[J]. Applied Soft Computing, 2023,141:110299. [百度学术]
Resende P A A, Drummond A E C. A survey of random forest based methods for intrusion detection systems[J]. ACM Computing Surveys (CSUR), 2018,51(3):1-36. [百度学术]
Mohapatra N, Shreya K, Chinmay A. Optimization of the Random Forest Algorithm[M]. Springer, 2020:201-208. [百度学术]
王奕森,夏树涛.集成学习之随机森林算法综述[J].信息通信技术,2018,12(1):49-55. [百度学术]
Karabadji N E I, Amara Korba A, Assi A, et al. Accuracy and diversity‑aware multi‑objective approach for random forest construction[J]. Expert Systems with Applications, 2023,225:120138. [百度学术]
吕红燕,冯倩.随机森林算法研究综述[J].河北省科学院学报,2019,36(3):37-41. [百度学术]