基于机器学习的水质处理单元预警系统设计与实现.pdf
《基于机器学习的水质处理单元预警系统设计与实现.pdf》由会员分享,可在线阅读,更多相关《基于机器学习的水质处理单元预警系统设计与实现.pdf(4页珍藏版)》请在咨信网上搜索。
1、信息记录材料 年 月 第 卷第 期基于机器学习的水质处理单元预警系统设计与实现李 艳,杨雨霖,杨 光(沈阳理工大学环境与化学工程学院 辽宁 沈阳)【摘摘要要】本文以沈阳市某污水处理厂为实验对象,对污水厂实际数据进行预处理,采用机器学习的回归决策树()、岭回归()、近邻()种算法预测出水水质(、)浓度。采用拟合优度()、均方误差()和平均绝对误差()来评估 种模型,选取表现最佳的算法作为出水水质的预测模型。实验结果表明,算法在预测出水 和出水 指标上表现最好;算法在预测出水 指标上表现最好;算法在预测出水 指标上表现最好。本文在出水水质预测模型的基础上,建立了污水处理出水水质预警系统,为解决污水
2、处理工艺中发生故障处理不及时的问题,提前预测出水水质,以期尽早发现、处理故障,实现污水处理的“事前”预警。【关关键键词词】污污水水处处理理;机机器器学学习习;水水质质预预测测【中中图图分分类类号号】【文文献献标标识识码码】【文文章章编编号号】()基金项目:沈阳理工大学博士启动资助项目();辽宁省博士科研启动基金计划项目()。作者简介:李艳(),女,辽宁沈阳,博士,教授,研究方向:环境规划与评价。引言污水处理厂是我国生态文明建设和改善水环境质量的重要基础设施。随着对水环境质量重视程度的增加,污水处理厂数量和处理能力得到了显著提升。污水处理是一个复杂的过程,涉及多个变量的耦合和非线性生化反应。当污
3、水处理厂发生故障时,出水水质指标可能无法达到标准,从而导致二次污染。因此,解决和实现污水处理系统的故障诊断与识别是一项重要任务。对污水处理出水水质进行预测研究,可以提前发现、隔离和处理故障,从而提高系统可靠性,确保长期稳定运行,这对于保证水处理过程的有效性至关重要。本文以沈阳市某污水处理厂为研究对象,采用回归决策树、岭回归、近邻算法对出水、以及 构建预测模型,采用拟合优度、均方误差以及平均绝对误差评估 种算法,根据评估结果来选取泛化能力最强的模型。同时,构建污水处理工艺的故障预警可视化系统,更科学、更快速、更有效地解决污水处理厂的故障问题。研究对象 某污水厂工艺流程本文以主体工艺为 的沈阳市某
4、污水处理厂为研究对象,设计规模为 ,出水水质执行城市污水处理厂污染物排放标准一级 排放标准。负责处理生活污水以及某工业园区产生的工业废水,主要出水水质指标有、。污水厂设计的进、出水水质指标如表 所示。表 污水厂设计进、出水指标()项目设计进水水质设计出水水质 数据预处理 数据清洗本文中数据清洗主要是指清洗无效、无价值的污水数据。在污水处理过程中,难免会出现传感器出现噪声等情况。因此,需要检查数据集中是否存在缺失值,即某些数据项未被记录或获取,剔除无效的数据样本,避免无效数据降低机器学习模型的训练效果。数据归一化不同特征具有不同的单位和范围,这会导致某些特征对模型训练的影响更大,而其他特征被忽略
5、。污水处理过程数据存在量纲不一致、特征间的数值差异性较大的情况,为了消除不同量纲差异性带来的影响,加快程序运行时的收敛速度,故将训练集数据和测试集数据分别进行归一化处理。归一化处理后各项污水指标的数据范围被控制在,。具体的标准化公式为式()所示:()()()()()()式()中,()为具有 个特征的样本 在通过归一化处理后的样本;()为具有 个特征的样本;()和()表示特征 的最大值和最小值。出水水质预测算法实现 回归决策树()决策回归树是采用树形结构对数据进行分类,遍历可用的特征集合,对每个特征进行评估。将数据集划分为 个区域空间,每个划分空间区域都对应一个输出值。回归决策树生成算法如式()
6、所示:()()()式()中,代表模型输出的回归树值;代表输入空间划分的 个区域;代表单元数据集;为输入空间划分的第 个单元,即,;代表常数;为每个所属区域的所有样本的均值。对于空间的划分,决策回归树会遍历每个特征,并在该特征上尝试不同的切分点。选择第 个变量作为切信息记录材料 年 月 第 卷第 期分变量和对应切分变量的某个取值,作为切分点(,),从而划分为两个区域 与,将大于 的特征值()划分至区域,将小于或等于 的特征值()划分至区域,表示如式()、式()所示:(,)()()(,)()()式()、式()中,(,)为切分点;为切分变量;为切分变量对应的取值。在寻找最优的切分点(,)时,需根据误
7、差平方和()计算,公式如式()所示:()()式()中,为每个样本的实际观测值,()为模型对于该样本的预测值。回归决策树在递归时类似于二叉树,即一个父节点有且仅有两个子节点。故要确定最优切分变量(最优初始指标)和它的最优取值(最优初始指标数值)时,就要找到两个区域的代表值 和 使各自区间上的误差平方和()最小。求解过程如式()所示:,(,)()(,)()()岭回归算法()岭回归与普通的线性回归面模型类似,目标都是通过对已知的污水水质数据集进行拟合来预测新的未知数据。不同的是,岭回归通过引入“岭惩罚项”来惩罚模型中某些参数过大的情况,以损失部分信息、降低精度为代价,使获得的回归系数更符合实际、更可
8、靠。具体方式是在原先 的最小二乘估计中,加入一个小扰动,使问题稳定并得以求解,可表示为式():()()()式()中,为岭参数;为单位矩阵。对于岭回归,当岭参数 在 到正无穷内变化时,岭回归系数 是 的函数。是一个向量,由,等多个分量组成,每一个分量都是 的函数,每一个分量画出的曲线被称为岭迹。若岭迹线的不稳定性很强,说明此时用最小二乘法不能很好地反映真实情况,需要根据岭迹线选择一个适当的岭参数 值,以确定回归系数。岭回归的核心思想就是改变误差平方和函数的几何形态使得误差平方和函数存在唯一最小值点。为了方便理解,假设一个简单的二元一次函数 为目标函数,引入“岭惩罚项”,示例如图 所示。近邻算法(
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 机器 学习 水质 处理 单元 预警系统 设计 实现
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。