石油化工过程的静态与时序数据组合建模.pdf
《石油化工过程的静态与时序数据组合建模.pdf》由会员分享,可在线阅读,更多相关《石油化工过程的静态与时序数据组合建模.pdf(9页珍藏版)》请在咨信网上搜索。
1、文章编号:1006-3080(2023)04-0489-09DOI:10.14135/ki.1006-3080.20220304001石油化工过程的静态与时序数据组合建模王杰1,陈博1,刘松2,欧阳福生1,戴宁锴1,赵明洋2(1.华东理工大学化工学院,石油加工研究所,上海200237;2.中国石化上海高桥分公司,上海200120)摘要:传统的石油化工过程建模中仅使用静态数据,而未能充分考虑连续生产过程中时序信息对建模指标的影响。本文提出了一种静态与时序数据组合网络(CNSS)模型,使用前馈神经网络提取静态数据的信息,使用 Bi-LSTM(Bidirectional-LongShortTermM
2、emory)和自注意力机制提取操作变量时序数据中的信息,其中 Bi-LSTM 提取操作变量在时序逻辑上的信息,自注意力机制提取操作变量之间的交叉信息,通过静态和时序数据信息的组合以获得更好的模型预测性能;并使用 CNSS 模型分别对 SZorb 装置精制汽油辛烷值(RON)、催化裂化烟气脱硝系统氮氧化物(NOx)的出口质量浓度进行预测,结果表明:CNSS 模型的预测精度明显高于仅使用静态数据的机器学习模型,其对精制汽油 RON 预测的平均绝对误差和平均绝对百分比误差分别为 0.1091、0.12%,对 NOx出口质量浓度预测的平均绝对误差和平均绝对百分比误差分别为 2.4430mg/m3、5.
3、60%。对于因工艺参数波动较大而需要考虑时序信息的石油化工过程,CNSS 模型可以为其建立机器学习模型提供重要参考。关键词:前馈神经网络;Bi-LSTM;自注意力机制;SZorb 工艺;FCC 烟气脱硝中图分类号:TE624文献标志码:A近年来,世界各工业强国先后提出了“智能制造”的概念1-3。石化行业作为我国的支柱产业,智能石化的发展与建设是提升智能制造水平的重要一环4-8。石油化工领域经过多年的建模、仿真、实验及自动化生产的发展,积累了大量的数据,而机器学习作为人工智能的子领域,其不需要基于规则的显示编程,就可以从数据中学习到隐藏的规律并做出合理的预测9。尤其近 10 年来机器学习中的深度
4、学习取得了突破性的进展10,越来越多的学者将机器学习模型应用到自己的研究领域,以促进石化领域数字化、智能化和智慧化的发展。石化装置运行的历史数据一般存储于实验室信息 管 理 系 统(Laboratory Information ManagementSystem,LIMS)和分散控制系统(DistributedControlSystem,DCS)中,其中 LIMS 系统记录的是与原料、产品等物料相关的性质数据(如密度),这些数据的获得需要对物料进行采样分析,且具有一定的采样频率,将这些数据统一称作性质变量。DCS 系统记录的是各装置连续运行的工艺参数数据,这些数据通常具有时序性和可调节性,将这些
5、数据统一称作操作变量。Y=F(X1,X2)以石化装置的历史数据为基础,采用机器学习算法构建装置指标(通常为产品性质或收率)的预测模型,可以抽象为过程,其中,F 为相关的机器学习模型,性质变量 X1=x1,x2,x3,xp;操作变量 X2=xp+1,xm2,xm1,xm;装置指标变量Y=y1,y2,y3,ye。装置指标的预测为回归任务,相关的机器学习模型可以分为参数模型和非参数模型两类。参数模型设定了目标函数的形式,可以极大地简化学习过程,如被广泛应用于数据分析领域的线性回归11。非参数模型不对目标函数进行过多的假设,可以从训练数据中学习任意形式的函数,包括收稿日期:2022-03-04基金项目
6、:中国石油化工股份有限公司合同项目(CLY19056)作者简介:王杰(1996),男,云南人,硕士生,主要研究方向为石油化工过程的建模与优化。E-mail:通信联系人:欧阳福生,E-mail:引用本文:王杰,陈博,刘松,等.石油化工过程的静态与时序数据组合建模 J.华东理工大学学报(自然科学版),2023,49(4):489-497.Citation:WANGJie,CHENBo,LIUSong,et al.CombinedModelingofStaticandSequentialDataforPetrochemicalProcessJ.JournalofEastChinaUniversity
7、ofScienceandTechnology,2023,49(4):489-497.Vol.49No.4华东理工大学学报(自然科学版)2023-08JournalofEastChinaUniversityofScienceandTechnology489支持向量回归12(SVR)、XGBoost13、深度神经网络14(DNN)等,SVR 的最终决策仅依赖于少量的支持向量,对噪声数据不敏感;XGBoost 为提升树模型,通过将多个具有依赖关系的弱学习器加权组合为一个强学习器;DNN 为多层前馈型神经网络,具有强大的非线性映射能力,可以应用于多种学习任务。传统的建模方式中,以性质变量的分析时间点为
8、基准,取操作变量对应的数据,因此,X1与 X2组成的样本 X 为静态数据(即某一时刻的数据)。然而石油化工装置都是连续生产的过程,除了当前状态的操作变量(静态数据)会对装置指标造成影响外,操作变量的波动(时序信息)也会对装置指标造成影响,因此,对装置指标进行预测时,不仅要考虑某一时刻的静态数据,还需要考虑这一时刻之前(如前2h 内)操作变量的时序信息。在此背景下,本文提出了一种静态与时序数据组合网络(CombinationNetworkofStaticandSequentialData,CNSS)模型,用于石化装置建模中的静态和时序数据信息提取,以期获得更好的预测性能,并分别在石化企业的 SZ
9、orb 装置和催化裂化(FCC)烟气脱硝系统中进行验证。1石油化工过程的静态与时序数据组合网络图 1 所示为 CNSS 的整体结构,建模数据分为静态数据和时序数据两部分,静态数据的 shape 为 n,m(n 为样本数,m 为变量数);时序数据的 shape 为n,d,mp(其中 d 为时间序列长度,mp 为操作变量数)。静态数据的信息提取采用常规的前馈神经网络进行,即图中的全连接层14(FullyConnectedLayer,FC);时序数据的信息提取采用 Bi-LSTM15(Bidirectional-LongShortTermMemory)和自注意力机制16(Self-attention
10、Mechanism)进行,其中 Bi-LSTM 用于提取操作变量在时序逻辑上的信息,而自注意力机制用于提取操作变量之间的交叉信息。提取到的信息在Concate 层进行拼接后,通过一个 FC 层进行输出得到装置指标。1.1 静态数据信息提取静态数据的信息提取采用前馈神经网络进行,由 FC 层、BN(BatchNormalization)层17和激活函数ReLU18构成一个结构单元(Block),通过堆叠多个结构单元以适应不同复杂度的任务。FC 层主要进行输入 x 与权值向量 w 的线性组合,如式(1)所示。zFC=xw+b(1)其中:zFC表示 FC 层的输出,b 表示偏置项。BN 层用于保持神
11、经网络每一层的输入有尽可能相同的分布,从而加速模型收敛、提高模型的泛化能力。BN 层将 FC 层的输出 zFC转换为均值为 0、方差为 1 的标准正态分布,同时为了增强网络的表达能力,通过 和 两个参数对标准正态分布进行缩放和平移(式(2),这两个参数在网络训练过程中可以自动学习得到。zbn=(zFC)+(2)Ti+1Ti=FCx2x1x3xpxp+1xp+2xp+3xmxp+1xp+2xp+3xmSequential data ofoperating variablesStatic data of propertyvariables and operatingvariablesBNReLUF
12、CBNReLUSelf-attentionSelf-attentionFlattenFCBi-LSTMBi-LSTMConcateFCBlock1Block2T1T2TiTdUnit index图1石油化工过程的 CNSS 结构图Fig.1StructurechartofCNSSforpetrochemicalprocess490华东理工大学学报(自然科学版)第49卷zbn式中:表示 BN 层的输出,和 分别为训练批次的均值和标准差。ReLU 用于对 zbn进行非线性转换,计算见式(3)。ReLU(zbn)=zbn,if zbn 00,if zbn 0(3)1.2 时序数据信息提取1.2.1B
13、i-LSTMLSTM19(LongShort-TermMemory)网络可用于提取操作变量在时序逻辑上的信息,为装置指标的预测提供更多的有用特征。LSTM 是为了解决 RNN20(RecurrentNeuralNetworks)网络的长期依赖问题而设计的,相比于原始 RNN 的隐藏层,LSTM 增加了一个细胞状态(ct),并引入了“门”结构。通过细胞状态可以将较早时间步长的信息传递至较后时间步长的细胞中,解决了短时记忆的问题,而信息的添加或移除主要通过“门”的机制进行。LSTM 设计了输入门(Inputgate,it)、遗忘门(Forgetgate,ft)、输出门(Outputgate,ot)
14、三道门21,如图2 所示。itotftctxthtInputgatextxtxtOutputgateForgetgate图2LSTM 的一个记忆单元Fig.2AmemoryunitofLSTM输入门 it主要用于将 xt的信息选择性地加入到细胞状态 ct中,其计算见式(4)。it=sigmoid(Wxixt+Whiht1+Wcict1+bi)(4)式中:sigmoid 为激活函数;W 为与其下标对应的权重矩阵,如 Wxi为输入门中关于 xt的权重矩阵;b 为与其下标对应的偏置;h 表示隐藏层状态。遗忘门 ft主要用于选择性地遗忘细胞状态中的信息,其计算见式(5)。ft=sigmoid(Wxfx
15、t+Whfht1+Wcfct1+bf)(5)通过输入门和遗忘门则可完成对细胞状态中信息的更新,其计算见式(6)。ct=ftct1+ittanh(Wxcxt+Whcht1+bc)(6)输出门 ot主要用于隐藏层状态 ht的更新,其计算见式(7)、式(8)。ot=sigmoid(Wxoxt+Whoht1+Wcoct1+bo)(7)ht=ottanh(ct)(8)LSTM 在当前的记忆单元进行计算时,仅能利用过去时刻的操作变量信息,而在研究操作变量的时序信息对装置指标的影响时,未来时刻的变化趋势也应考虑在内。Bi-LSTM 通过两个单独的隐藏层在前后两个方向上将时序信息提取到同一个 T 输出层,如图
16、 3 所示。因此,操作变量在时序逻辑上的信息可以通过堆叠多个 Bi-LSTM 结构进行提取。ot1xt1xt+1xtotot+1Input layerht1ht1ht+1htht+1htForward layerBackward layerOuput layer图3Bi-LSTM 示意图Fig.3SchematicdiagramofbidirectionalLSTM1.2.2自注意力机制自注意力机制为注意力机制的一种,其可以学习到序列数据中任意两项的相互关系,并将所有项的信息赋予每一项。LSTM 通过重复隐藏层状态完成时序信息前后的传递,为时序逻辑;而自注意力机制通过一组矩阵运算即可完成各项之
17、间的信息共享。因此,可使用自注意力机制对操作变量的时序数据进行特征交叉,即通过学习各操作变量之间的交叉信息,进一步为装置指标的预测提取有用特征。xi Rdxzi Rdz对于输入序列 x=xp+1,xp+2,xi,xm,其中(dx 表示向量 x 的维度,以此类推),通过自注意力机制可以计算得到一个新的序列 z=zp+1,zp+2,zi,zm,其中。每个输出元素 zi为输入元素线性变换的加权和,如式(9)所示。zi=mj=kij(xjWV)(9)ijR式中:为权重系数;WVdxdz,为网络所需学习的参数矩阵。ij每个权重系数通过 Softmax 函数计算得到,如式(10)所示。ij=exp(eij
18、)mq=kexp(eiq)(10)eij是通过兼容函数(CompatibilityFunction)计算得到,如式(11)所示。第4期王杰,等:石油化工过程的静态与时序数据组合建模491eij=(xiWQ)(xjWK)Tdz(11)R式中:WQ、WKdxdz,为网络所需学习的参数矩阵。图 4 示 出 了 操 作 变 量 xp+1的 时 序 数 据 向 量xp+1,1;xp+1,2;xp+1,d 与其余操作变量的时序数据向量进行特征交叉的过程,通过自注意力机制进行特征交叉后,操作变量 xp+1融合了其余操作变量的信息,得到向量 zp+1=zp+1,1;zp+1,2;zp+1,s,s 由参数矩阵
19、WQ、WK和 WV的大小进行确定。其余操作变量按同样的方式进行特征交叉后,得到的输出 z 仍然为序列。为了与其余单元提取到的信息维度保持一致,使用 Flatten 层将其打平为一维,并使用一个 FC 层进行信息压缩。实际使用注意力机制单元时,可以依据操作变量时序数据的复杂程度,相应设置单头或多头自注意力机制。qp+1kp+1vp+1qp+2kp+2xp+2xp+1vp+2qmkmxmvmzp+1p+1,p+1p+1,p+2p+1,m图4一个操作变量的时序数据与其余操作变量的时序数据进行特征交叉的示意图Fig.4Schematic diagram of feature crosses betwe
20、en oneoperatingvariableandotheroperatingvariables 1.3 优化算法使用均方误差(MSE)作为 CNSS 的损失函数,则网 络 的 学 习 和 训 练 可 以 通 过 随 机 梯 度 下 降22(StochasticGradientDescent,SGD)、Adam23等优化算法进行。与 SGD 保持单一的学习率不同,Adam算法通过计算历史梯度的一阶矩估计和二阶矩估计来为待更新参数设计不同的自适应学习率,在深度学习模型的训练中得到了广泛应用。因此,本研究采用 Adam 算法对 CNSS 网络进行训练,对于目标函数 f(),参数 从第 t1 次迭
21、代到第 t 次的更新步骤见式(12)(17)。gt=ft(t1)(12)mt=1mt1+(11)gt(13)vt=2vt1+(12)gt2(14)mt=mt11t(15)vt=vt12t(16)t=t1 mt vt+(17)mt vt式中:gt为 f()对当前参数 的梯度;mt、vt分别为有偏一阶矩估计和二阶矩估计;1、2分别为一阶矩估计和二阶矩估计的指数衰减率,一般设置为 0.9 和0.999;、分别为进行偏差修正后的一阶矩估计和二阶矩估计;为学习率,其决定参数 的更新步长,本文设置为 0.001;用来避免分母为 0,一般设置为 108。2验证实例由美国康菲石油公司(ConocoPhilli
22、ps,COP)开发、中国石化股份公司整体收购并进行技术提升的 SZorb 工艺24是我国生产超低硫汽油的核心技术之一,具有汽油收率高、辛烷值(RON)损失小、硫含量低的优点;选择性催化还原25(SelectiveCatalyticReduction,SCR)技术是目前针对 FCC 再生烟气脱硝系统氮氧化物(NOx)的主要技术之一。为了验证CNSS 模型在实际建模中的预测性能,分别对 SZorb装置精制汽油 RON 预测结果、FCC 烟气脱硝系统 NOx出口质量浓度预测结果进行验证。为了将 CNSS 与静态模型的预测效果进行对比,采用 SVR、XGBoost、DNN 这 3 种模型在同样的静态数
23、据上进行训练和测试,且为了保证 CNSS 与静态模型之间对比的公平性,3 个静态模型的超参数都通过交叉验证进行调优,尽量使其达到本模型的最佳预测效果。同时为了验证 CNSS 使用 Bi-LSTM 单元和自注意力机制单元提取时序数据信息更具优势,将 CNSS 中的 Bi-LSTM 单元分别替换为 RNN(CNSS-RNN)、LSTM(CNSS-LSTM)和不使用自注意力机制单元(CNSS-NoAttention),得到 3 个同样可以提取操作变量时序数据信息的模型(动态模型),并在同样的数据上进行训练和测试。2.1 S Zorb 装置精制汽油 RON 预测2.1.1数据采集及建模变量筛选数据来源
24、于某石化企业 SZorb 装置的 LIMS 系统和 DCS 系统的历史数据。从 LIMS 系统采集了 2017 年 4 月到 2020 年9 月的物性数据,包括原料、产品、吸附剂和循环氢组成在内的共计 14 个性质变量,这些变量的分析频率存在差异,原料和精制汽油的 RON 为 2 次/周。由492华东理工大学学报(自然科学版)第49卷于 RON 为装置指标(预测目标),因而以 RON 的分析频率为基准,整理得到 347 组静态数据样本。每次操作变量的采集间隔为 6min,包括氢油体积比、反应过滤器压差、还原器压力等 301 个变量;以 RON的分析时间为基准,取该时间点前后各 1h 的平均值作
25、为操作变量的静态数据,该时间点前 2h 的数据作为操作变量的时序数据。对于采集得到的 14 个性质变量和 301 个操作变量,通过最大信息系数26(MaximalInformationCoefficient,MIC)和 Pearson 相关系数筛选出了 21 个与精制汽油 RON 相关性高且相互独立的变量,见表 1。因此,性质变量静态数据、操作变量静态数据、操作变量时序数据的 shape 分别为:347,9、347,12、347,21,12(21 为时序长度,2h 内以 6min为间隔所得到)。表1精制汽油 RON 预测模型的建模变量Table1ModelingfeaturesofRONpre
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 石油化工 过程 静态 时序 数据 组合 建模
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。