当前位置: 首页 > news >正文

第六十一周周报 MDSSSA-GNN

week 61 MDSSSA-GNN

摘要

本周阅读了题为A novel hybrid efficiency prediction model for pumping well system based on MDS–SSA–GNN的论文。该文提出了一种用于抽水井系统效率预测的混合模型(MDS-SSA-GNN)。该模型利用 Pearson 积矩相关系数(PPMCC)计算各影响因素与系统效率的相关系数,采用多维尺度变换(MDS)进行数据降维,并使用最大-最小归一化对影响因素进行处理。接着,采用图神经网络(GNN)预测抽水井系统的效率,并利用麻雀优化算法(SSA)优化网络参数。最后,通过最大-最小逆归一化得到预测结果。通过随机选取的100口实际油井进行对比分析,验证了该模型的有效性,表明其能够准确预测系统效率,提升油井抽油系统的预测准确性。

Abstract

This week’s weekly newspaper decodes the paper entitled A novel hybrid efficiency prediction model for pumping well system based on MDS–SSA–GNN. The paper proposes a hybrid model (MDS-SSA-GNN) for predicting the efficiency of pumping well systems. The model uses the Pearson Product-Moment Correlation Coefficient (PPMCC) to calculate the correlation coefficients between various influencing factors and system efficiency. It employs Multidimensional Scaling (MDS) for data dimensionality reduction and applies max-min normalization to process the influencing factors. Subsequently, a Graph Neural Network (GNN) is used to predict the efficiency of the pumping well system, with network parameters optimized using the Sparrow Search Algorithm (SSA). Finally, the prediction results are obtained through inverse max-min normalization. The effectiveness of the model is validated through comparative analysis using 100 randomly selected actual oil wells, demonstrating that it can accurately predict system efficiency and improve the accuracy of efficiency predictions for oil well pumping systems.

一、文献阅读

1. 题目

标题:A novel hybrid efficiency prediction model for pumping well system based on MDS–SSA–GNN

作者:Biao Ma. Shimin Dong

发布:energy science engineeering(三区)

  • Received: 5 January 2024| Revised: 3 April 2024| Accepted: 13 May 2024

DOI: 10.1002/ese3.1807

2. Abstract

本文提出了一种用于抽水井系统效率预测的混合模型(MDS-SSA-GNN)。该模型由Pearson积矩相关系数(PPMCC)、多维尺度变换(MDS)、最大-最小归一化、麻雀优化算法(SSA)、图神经网络(GNN)和最大-最小逆归一化六个部分组成。首先,利用PPMCC定量计算各影响因素与系统效率之间的相关系数大小。其次,采用最大最小归一化原则,对主要影响因素进行最小最小归一化和最小最小最小值归一化。第三,采用GNN算法对抽油机系统效率进行预测,并采用SSA算法对网络参数的初值进行优化。最后,利用最大-最小反规范化方法得到预测结果。为了验证模型的准确性,本研究随机选取100口实际油井进行对比分析,分析混合算法的结构参数对系统效率预测精度的影响。分析结果表明,该模型能有效地预测系统效率,对提高油井抽油系统效率预测的准确性具有一定的作用。

3. 文献解读

3.1 Introduction

针对上述问题,本文提出了一种基于Pearson积矩相关系数(PPMCC)、多维尺度(MDS)变换、最大最小归一化、图神经网络(GNN)、麻雀优化算法(SSA)和最大最小逆归一化的混合预测模型。首先,进行Pearson相关系数分析,定量计算抽油井系统效率与各影响因素之间的相关系数大小,确定抽油井系统效率的影响因素;解决了目前抽水井系统效率影响因素选择不完全、各影响因素与系统效率之间因果关系考虑不清的问题。其次,对输入数据进行MDS变换降尺度并进行最大值和最小值归一化,数据降尺度解决了由于输入维数大导致神经网络预测时间成本增加的问题,归一化解决了影响数据的各种因素之间尺度不一致造成的影响。将缩小后的归一化数据代入图形化神经网络,并利用SSA对网络的初始参数进行优化。最后,通过逆归一化得到最终预测结果,并分析了混合算法的结构参数对预测精度的影响。

3.2 创新点

该文提出了一种用于抽水井系统效率预测的混合模型(MDS-SSA-GNN),主要贡献有三个方面:

  1. 进行Pearson相关系数分析,定量计算抽油井系统效率与各影响因素之间的相关系数大小,确定抽油井系统效率的影响因素
  2. 对输入数据进行MDS变换降尺度并进行最大值和最小值归一化,数据降尺度解决了由于输入维数大导致神经网络预测时间成本增加的问题,归一化解决了影响数据的各种因素之间尺度不一致造成的影响。将缩小后的归一化数据代入图形化神经网络,并利用SSA对网络的初始参数进行优化
  3. 通过逆归一化得到最终预测结果,并分析了混合算法的结构参数对预测精度的影响

4. 网络结构

$$

$$

该文提出了一个新的框架NLA-GNN,它可以聚合来自本地邻居和远程节点的信息来生成异构图的嵌入。图2给出了NLA-GNN的整体框架。NLA-GNN由多层组成,每层包含两个聚合层:本地聚合层和非本地聚合层(NL-Layer)。具体来说,NLA-GNN利用基于注意力的方法来组成每个边类型的邻接矩阵,因此可以将异构图视为同质图,并使用图卷积网络(GCN)层与复合邻接矩阵实现局部聚合。在本地聚合层之后,非本地聚合层根据节点的类型将节点划分为𝐾𝑣类。它使用注意力引导排序来打乱每个类中节点的顺序(类型排序)。此外,非局部聚合层对图中的所有节点进行洗牌,而不管它们的类型(全局排序)。然后,排序后的节点形成多节点序列。nl层对每个序列使用一维卷积神经网络层进行信息聚合。由于排序过程是注意力引导的,并且与图结构无关,因此节点可以从非局部节点中聚合信息。在框架的最后,使用一个额外的本地聚合层将嵌入映射到指定的维度,然后可以用于下游任务。

4.1 数据类型和处理系统效率

为了研究抽水井系统效率的深度学习预测模型,首先要分析抽水井系统效率数据库中的数据类型。本文从待分析的数据库中截取部分数据,如表1所示。

从表1中可以看出,电机类型、泵机类型和平衡模式为字符串数据,其余为数字类型数据。字符串数据通过编码转换为数字类型数据。

4.2 皮尔逊相关系数

为了筛选出影响抽油机系统效率的主要影响因素,本研究采用PPMCC进行了相关分析。在统计学中,PPMCC32,33可以用来度量两个变量 X = ( x 1 , x 2 , … , x n ) , a n d , Y = ( y 1 , y 2 , … , y + n ) X=(x_1,x_2,\dots,x_n),and,Y=(y_1,y_2,\dots,y+n) X=(x1,x2,,xn),and,Y=(y1,y2,,y+n)之间的相关性。其值在−1 ~ 1之间,表示两个变量之间的线性相关程度,绝对值越大,相关性越强。Pearson相关系数计算公式如下:
r = ∑ i = 1 m m ( x i − μ X ) ( y i − μ Y ) ∑ i = 1 m m ( x i − μ X ) 2 ∑ i = 1 m m ( y i − μ Y ) 2 r=\frac{\sum^{m_m}_{i=1}(x_i-\mu_X)(y_i-\mu_Y)}{\sqrt{\sum^{m_m}_{i=1}(x_i-\mu_X)^2}\sqrt{\sum_{i=1}^{m_m}(y_i-\mu_Y)^2}} r=i=1mm(xiμX)2 i=1mm(yiμY)2 i=1mm(xiμX)(yiμY)

4.3 混合MDS-SSA-GNN算法

由于影响抽油井系统效率的因素比较多,多达十几个,且大小不一。如果直接作为GNN的输入,会增加时间成本和收敛难度。因此,为了解决抽油机井系统效率数据集维数较大,且各影响因素之间的量级不一致导致抽油机井系统效率预测性能下降的问题,本文提出了一种混合型MDS-SSA-GNN算法,混合型MDS-SSA-GNN算法流程如下:

步骤(1)输入泵井系统效率的所有影响和预测特征,并使用Pearson相关系数进行分析。

步骤(2).使用MDS方法进行降维和归一化。

步骤(3).确定图神经网络的拓扑结构。

步骤(4).初始化GNN的权值和阈值。

步骤(5).计算总体适应度。

步骤(6).发现者,追随者和警戒位置更新。

步骤(7).计算总体适应度。

步骤(8).判断终止条件是否满足,如果成立,则进行下一步操作,如果不成立,则重复(6)-(8)的过程。

步骤(9).输出最优权值和阈值参数。

步骤(10)。将输出的最优权值和阈值参数加载到GNN模型中进行训练和仿真预测。

算法流程图如图3所示

5. 实验过程

5.1 影响抽油井系统效率因素的相关性分析

本研究从西部某油田数据库中选取5000个数据样本进行研究分析,定量计算各影响因素对系统效率的Pearson相关系数,如表2所示,相关系数热图如图4所示。

通过对Pearson相关系数的表和热图分析可知:

  1. 电机类型对系统效率的影响因子的大小为- 0.0093。平衡模式对系统效率的影响因子的大小为- 0.0097。Balance对效率的影响因子的大小为- 0.22。狗腿度对系统效率的影响因子的大小为- 0.14。天然气相对密度对系统效率影响的因子大小为- 0.035。冲击距离对系统效率的影响因子大小为−0.015。电枢数对系统效率影响的因子大小为- 0.088。冲程对系统效率影响的因子大小为- 0.041。Punch对系统效率影响的因子大小为- 0.21。抽油杆级数对系统效率影响的因子大小为- 0.039。抽油杆直径对系统效率的影响系数为- 0.053。以上影响与系统效率呈负相关。
  2. 抽油机类型对系统效率的影响因子大小为0.076。井液密度对系统效率影响因子的大小为0.034。油压对系统效率影响因子的大小为0.0037。套管压力对系统效率影响因子的大小为0.016。含水率对系统效率影响因子的大小为0.2。移动液面对系统效率影响的因子大小为0.04。泵隙等级对系统效率的影响因子的大小为0.025。燃油管规格对系统效率的影响系数为0.037。低泵深对系统效率影响的因子大小为0.095。泵径对系统效率的影响系数为0.35。抽油杆长度对系统效率的影响因子的大小为0.31。井斜角对系统效率影响因子的大小为0.041。上述影响与系统效率呈正相关。
  3. 根据热图的颜色深浅可以看出,各影响因素对系统效率都有一定的影响,但各影响因素与系统效率的相关程度不同,相关关系如下:泵直径>气油比的抽油杆长度> >穿孔>水>的内容以及流体粘度地理>dog-leg度>泵>的深度校正设备的数量>消防车类型> >油井抽油杆直径>中风倾角的动态水平> > >抽油杆阶段油管规范> >饱和压力的天然气相对密度>井流体密度> >套管压力泵间隙水平>推距>平衡方式>电机类型>平衡度>油压。

5.2 评价指标

本文对抽油井系统效率预测模型精度的评价指标采用回归模型中常用的4个重要指标,即均方误差(MSE)、均方根误差(RMSE)、R2和平均绝对误差(MAE)。为了定量评价所构建系统的预测性能,误差越小,模型的预测精度越高。

5.3 抽油井系统效率预测精度验证

预测的抽油井系统效率与实际抽油井系统效率基本相等,最小误差接近0,最大误差接近0.65,表明本文提出的混合MDS-SSA-GNN算法可以很好地预测系统效率。

5.4 混合MDS-SSA-GNN算法结构参数对预测性能的影响分析

由于MDS-SSA-GNN混合算法的结构参数对抽油井系统效率预测影响较大,采用控制变量法研究MDS-SSA-GNN混合算法的结构参数对抽油井系统效率预测性能的影响。

5.4.1 学习率对预测性能的影响

为了研究学习率对抽油井系统效率预测性能的影响,选取学习率大小为0.0001、0.0005、0.001、0.005和0.01,研究不同学习率对基于控制变量法的训练集和验证集的MSE和RMSE的影响,如表3所示。

  1. 随着学习率的增加,训练集的MSE略有下降,而验证集的MSE基本保持不变。
  2. 随着学习量的增加,训练集的RMSE呈下降趋势,而验证集的RMSE呈上升趋势。
  3. 随着学习率的增加,训练集和验证集的R2都增加。随着学习率的增加,训练集和验证集的MAE略有下降。
  4. 随着学习率的增加,MSE之间的差距以及训练集和验证集的RMSE之间的差距逐渐增大,这是因为随着学习率的增加,神经网络无法学习到全局最优解,使得模型训练不足,预测精度下降。

5.4.2 批大小对预测性能的影响

为了研究批次大小对抽油井系统效率预测性能的影响,选取批次大小为20、30、40、50和60,研究基于控制变量法的不同批次大小对训练集和验证集的MSE和RMSE的影响,如图6所示。

  1. 随着批量的增加,训练集的MSE保持不变,验证集的MSE保持不变。
  2. 随着批量的增加,训练集的RMSE呈现轻微的振荡趋势,而验证集的RMSE基本保持不变。
  3. 随着批量的增加,训练集和验证集的MAE有增加的趋势,训练集和验证集的R2逐渐增大。
  4. 随着batch的增加,训练集和验证集的MSE与RMSE之间的差距逐渐减小,说明增加batch可以提高预测精度。

6. 结论

  1. 提出了基于PPMCC、MDS变换、最大最小归一化、GNN、SSA和最大最小逆归一化的混合抽油机井系统效率预测模型(MDS - SSA - GNN)。
  2. 首先,基于PPMCC原理定量计算了各影响因素对抽油井系统效率的相关系数;其次,基于MDS和最大最小归一化原则,对输入数据进行处理,解决了输入维数过大、数量级不一致导致的预测成本高、预测精度低的问题。在此基础上,利用SSA算法对GNN结构的初始参数进行优化,并对抽油井系统的效率进行预测。最后,利用最大最小逆归一化得到最终预测结果。
  3. 结合实际油井验证了模型的准确性,验证结果说明了本文提出的混合模型的有效性。最后,进一步分析了混合MDS-SSA-GNN模型结构参数对预测性能的影响。

参考文献

[1] :Siheng Wang, Guitao Cao, Wenming Cao, Yan Li. NLA-GNN: Non-local information aggregated graph neural network for heterogeneous graph embedding .[J] Pattern Recognition DOI:10.1016/j.patcog.2024.110940

[2] Dongyue Chen , Ruonan Liu , Qinghua Hu, and Steven X. Ding. Interaction-Aware Graph Neural Networks for Fault Diagnosis of Complex Industrial Processes. [J] IEEE TRANSACTIONS ON NEURAL NETWORKS AND LEARNING SYSTEMS, VOL. 34, NO. 9, SEPTEMBER 2023 DOI:10.1109/TNNLS.2021.3132376


http://www.mrgr.cn/news/54237.html

相关文章:

  • 使用RabbitMQ实现延迟消息的完整指南
  • springboot接口Get请求实体类入参
  • 杨笠代言风波:京东股价逆流而上?
  • [LeetCode] 733. 图像渲染
  • 通过无线路由器连接三菱PLC的设置方法
  • MySQL企业常见架构与调优经验分享
  • 计算机毕业设计Spark+大模型高考分数线预测 知识图谱高考志愿推荐系统 高考数据分析可视化 高考大数据 大数据毕业设计
  • 【洛谷】P1856
  • 【H2O2|全栈】WPS/Office系列有哪些好用的快捷方式?
  • Javaweb基础-axios
  • 学习虚幻C++开发日志——TSet
  • 推荐系统 # 二、推荐系统召回:协同过滤 ItemCF/UserCF、离散特征处理、双塔模型、自监督学习、多路召回、曝光过滤
  • MySQL 索引:优化数据库性能的关键
  • Java的重载和主要内存区
  • 开发工具(上)
  • [SAP ABAP] SE11定义数据类型(结构与表类型)
  • 模型轻量化1--模型剪枝
  • AI周报(10.13-10.19)
  • 把自己写的文章发布在各大媒体网站上难不难?
  • 【每日一题】【算法双周赛】【第 20 场 小白入门赛评价/分享】赛后另类AI写题分析分享
  • 2025年天津仁爱学院专升本动画化学工程与工艺专业对应专业限制
  • 《嵌入式最全面试题-Offer直通车》目录
  • Lua字符串
  • JDK 1.6主要特性
  • 我的JAVA项目构建
  • 怎么修改编辑PDF的内容,有这4个工具就行了。