基于多传感器的室内人数检测模型.pdf
《基于多传感器的室内人数检测模型.pdf》由会员分享,可在线阅读,更多相关《基于多传感器的室内人数检测模型.pdf(8页珍藏版)》请在咨信网上搜索。
1、 doi:10.3969/j.issn.2095-4468.2023.03.204 基于多传感器的室内人数检测基于多传感器的室内人数检测模型模型 冯佳璐,杜志敏,晋欣桥,朱旭 (上海交通大学制冷与低温工程研究所,上海 200240)摘摘 要要 本文研究了数据挖掘在基于室内人数的建筑节能方向的应用,搭建了一套以无线传感器网络为基础的室内人数测量系统,采用基于相关性的特征选择算法从中选择与室内人数相关度最高的 6 类传感器组合,并通过支持向量回归、决策树、随机森林等数据挖掘方法进行了室内人数检测方法的研究,用以在不侵犯人员隐私的前提下实现室内人数的评估。结果显示三种方法均能有效推理室内人数,其中随
2、机森林由于其集成特点使得基学习器之间得到互补,得到了最优的泛化性能,模型的均方误差、平均绝对误差、标准化平均绝对方差分别为 0.007、0.006 和 0.083,优于其他两个模型。关键词关键词 室内人数;测量方法;特征选择;数据挖掘 中图分类号:中图分类号:TU201.5;TP212.9 文献标识文献标识码:码:A Model for Indoor Occupancy Estimation Based on Multi-sensor FENG Jialu,DU Zhimin,JIN Xinqiao*,ZHU Xu(Institute of Refrigeration and Cryogeni
3、cs,Shanghai Jiao Tong University,Shanghai 200240,China)Abstract Application of data mining in building energy conservation based on indoor population is studied in this paper.An indoor people counting system based on wireless sensor network(WSN)is built and used to collected the state features of th
4、e indoor environment.Correlation based Feature Selection is used to select the six sensor combinations with the highest correlation with the indoor population.Then the indoor people counting prediction method is conducted based on support vector regression,decision tree and random forest to provide
5、support for decision-making of the air conditioning operation system.The results show that all the three methods are effective in inferring the number of people in the room,among which the random forest,due to its ensemble characteristics which makes the base learner complement each other,obtains th
6、e optimal generalization performance and the optimal inferring result.The MSE,MAE and NMSE of the model were 0.007,0.006 and 0.083,which were superior to the other two models.Keywords Occupancy;Measuring method;Feature selection;Data mining 晋欣桥(1965),男,教授,博士。研究方向:制冷空调系统节能及优化控制。联系地址:上海市闵行区东川路 800 号上海
7、交通大学制冷与低温工程研究所,邮编 200240。联系电话:021-34206774。E-mail:。0 引言引言 在“减碳”的时代背景下,制冷空调行业作为能源消耗的主要行业存在机遇和挑战1,其中建筑空调能耗及室内空气品质与室内人数息息相关。目前对室内人数及行为的描述大都依据相关标准或个人经验采用静态时间表对室内人员进行描述,如ASHRAE Standard 90.120042对办公楼的室内占用率做出了相关规定。这些标准和规范并未考虑到室内人员的随机性,采用静态时间表对不同建筑进行统一描述会与实际状况产生很大误差。谭时锴3在研究中采用熵权法确定了用户行为数据的权重后,进行后续的研究分析。DUA
8、RTE 等4对某大型办公建筑进行了 23 个月的统计,分析了不同空间中室内人员行为,与ASHRAE Standard 90.1 为 2004中的在室作息曲线相比差异较大,部分差异率高达46%。丁云霄等5构第43卷 第3期 2023年6月 制 冷 技 术 Chinese Journal of Refrigeration TechnologyVol.43,No.3 Jun.202358 建了室内人员行为与设备匹配性的相关指标参数,在此指标基础上描述了制冷系统变得运行节能潜力。CHANG 等6采集了照明开关数据,分析了 200 间办公室的使用情况,证明室内人员的随机性是导致建筑物能耗预测偏差的原因之
9、一。室内人员对其所在建筑室内环境的影响不同。由于每个人都在释放热量和污染物(如水蒸气、二氧化碳和气味等),所以人的存在直接改变了室内环境。一项针对美国住宅能源消费结构的研究表明,美国住宅建筑能源消费高度依赖于居住者是否在建筑中居住,与居家率值密切相关7。居住者也存在与建筑互动,以提高居住者自身的居住舒适度。例如,居住着可能采用加热,冷却或通风等措施来改善室内环境,调整照明系统或百叶窗来优化室内视觉舒适度。人对环境的影响存在一定的滞后性,基于环境参数的 HVAC 控制策略是间接消除室内人员活动对室内环境的影响;建筑中电器设备不仅消耗水电、废弃物的产生也会影响环境,进而造成基于环境参数的 HVAC
10、 控制策略失效。同时由于新风风量主要由室内人数决定,考虑到新风系统在建筑总能耗中的占比高达 20%50%8-9。由此,建筑内人员在室行为研究,不仅在建筑能耗模拟方面有所应用,也适用于建筑空调系统运行控制。目前室内人数预测研究主要是在采集在室人数相关数据(如室内环境参数)的基础上,采用不同数学方法以建立动态预测模型。所采用的数学模型主要包括统计概率模型10-11、基于 Agent 建模12-14、随机过程模型15-17及数据挖掘模型。统计概率模型仅适用于几种特定的室内人员行为(例如开窗或开灯),难以建立一个全面的行为模型与能耗仿真软件集成18;随机过程建模更适合长期室内时间表的预测或分类,不太适
11、于研究具体的室内人员行为和居住人数;基于 Agent 建模与随机过程建模类似,此方法没有形成体系化的方法对室内人员行为进行全面的预测,还需要提高模型的完整性。而数据挖掘模型的结果准确度较高,是当前应用较为广泛的模型,常见算法有人工神经网络(Artificial Neural Network,ANN)19、C4.5、支持向量回归(Support Vector Regression,SVR)20-21、自回归综合移动平均值(Autoregressive Integrated Moving Average Model,ARIMA)22。建立室内人员检测模型需要提供一定量与人员相关的参数,选择哪些测量
12、参数以避免不必要的测量是室内人员检测模型的关键。HAILEMARIAM等23使用决策树对PIR 运动传感器数据、CO2浓度、分贝、照度和设备功率等参数进行分析,他们发现过多传感器的数据可能存在过拟合现象,反而使得精度降低。布置摄像头结合图像识别来统计室内人数是一种可行的方法,但是在室内布置摄像头会侵犯公民的隐私。因此,搭建一个低成本的、不侵犯隐私的传感器系统以建立室内人员检测模型是有必要的。本文选取上海某高校一间多人办公室进行数据采集,结合物联网技术搭建一套复杂的无线传感器网络,采集与室内人员相关的多个参数,研究室内人数与各参数之间的相关性。采用基于相关性的特征选择(Correlation b
13、ased Feature Selection,CFS)算法进行特征选择,并分别建立了室内人数的随机森林、支持向量回归和决策树模型,分析三种模型对其室内人数检测的准确率及误判率。1 室内人数监测实验室内人数监测实验 1.1 监监测测系统系统 本文对位于上海市闵行区的一栋教学楼进行案例研究,对该房间进行连续两周的实时监测,实验期间办公室的最大人数为 6 人。在被监测的房间里,布置了 11 种共 13 个传感器组成一套人数监测系统,用于测量室内环境和人体活动的影响参数,其中,用于室内人员检测模型的传感器共 9 种(如表 1 所示),包括温度、相对湿度、室内污染物颗粒浓度、CO2/VOC 浓度和分贝值
14、等;用于真实人数统计的传感器共两种,包括门窗开/闭和人体红外传感器。传感器的布置如图 1 所示。这套人数监测系统系统基于 Ardunio 开发,将各传感器的数据通过低功耗无线传输系统传送到配有 WIFI 的 Ardunio无线传输模块上,实现远程监控和数据采集。为了能够将室内人数与传感器数据关联,需要了解测量时段内室内人数的真实值,本文在该区域安装摄像头,每隔 1 min 拍摄一次图像,通过人工统计的方法获得室内的真实人数,该数据将用于模型的训练与验证。为保证人工统计数据的便利性和可靠性,本文还增加了门开合传感器和人体红外传第43卷 第3期 2023年6月 制 冷 技 术 Chinese Jo
15、urnal of Refrigeration TechnologyVol.43,No.3 Jun.202359 感器,因为每次开关门和人体红外传感器的感应时室内人数都有可能改变,便于在关键时间节点检查人工统计数据的准确性。实验连续采集了 16 天的数据,采集间隔为 4 min,共获取 5 760 组数据。表表 1 测点定义及说明测点定义及说明 编号 参数 精度 1 相对湿度 RH/%1 2 温度 t/0.1 3 PM10/(ug/m3)4 PM2.5/(ug/m3)5 PM1/(ug/m3)6 HCHO 浓度 nHCHO/(mg/m3)0.02 7 CO2浓度 nco2/mol/L 40 8
16、VOC 浓度 nVOC/(mg/m3)0.1 9 室内分贝 N/dB 0.1 1.2 数据预处理数据预处理 试验获取的数据在使用前需要进行预处理,包括归一化、异常值去除和缺失值处理。由于数据中不同量之间的量纲差别很大,不经数据预处理直接进行模型训练的效果很差,因此需要对数据进行归一化处理。机器学习中较为常见的归一化方法有两种,中心分布归一化指的是将每行数据归一化使归一化后的数据均值为 0,方差为 0;极值分布归一化是将每行数据处理到在-1,1区间。本文采用极值分布归一化。在实际数据采集的过程中,由于随机干扰的存在,往往不能直接测得所需变量的真实值。从夹杂有随机噪声的观测信号中准确地得到所需的状
17、态变量是不可能的,只能根据观测信号来估计或预测状态变量。本文使用了 Kalman 滤波器进行数据预处理,消除信号中的高频噪声,Kalman 滤波主要分为预测和校正两个步骤,过程如下:11kkkxAxBu=+(1)T1kkPAPAQ=+(2)TT1()kkkKPHHPHR=+(3)()kkkkxxK zHx=+(4)(1)kkkPK H P=(5)式中,P 为 x 的协方差矩阵;K 为卡尔曼增益;Q为输入噪声的协方差矩阵;R 为观测噪声的协方差矩阵。2 特征选择特征选择 2.1 CFS 算法算法 本文用基于相关性的特征选择对特征进行排序,以研究每个特征与室内人数的相关性。该相关特征选择器过滤器也
18、被称为基于相关性的特征选择(Correlation based Feature Selection,CFS),CFS使用基于相关性的启发式来评估特征的价值,最终获得与室内人数相关的主要特征。特征选择不仅可以为后续数据挖掘工作减少训练和调优的时间,筛选出的主要特征也明确了必须布置的传感器,节省硬件成本。CFS通过考虑每个特征的单独预测能力以及它们之间的冗余度来评估属性子集的价值17,对特征子集进行评估和排序而不是对单个特性进行排序。CFS 的核心是采用启发的方式评估特征子集的价值。启发方式基于假设:好的特征子集包含与类高度相关的特征,但特征之间彼此不相关。Ms为包含k 个特征的特征子集 S 的启
19、发式,启发式方程如式(6)式(7)所示。启发式方法去除对类预测不起作用的特征变量,并识别与其他特征高度相关的特征。cf_asff_a(1)krMkk kr=+(6)cf_a1=(,)iirfSf Ck(7)式中,r 为 Pearson 相关系数,所有变量需要标准化;rcf_a特征-类平均相关性;rff_a为特征-特征平均相关性;S 为包含 k 个特征的特征子集;C 为上一轮搜索所得特征子集,包含 k-1 个特征;k 为特征子集中的特征数,k1,2,3,p,p 为数据集的特征总数。由于遍历所有特征子集的计算量大,各种启发式搜索策略如 Hill Climbing 和 Best First 经常被用
20、于在合理的时间内搜索特征子集空间,其中 Best First Search 结果稍优17。CFS 首先从训练集中计算特征-类和特征-特征相关矩阵,再用 Best First Search 搜索特征子集空间。设数据集共有 p 个特征,该数据集的特征集合 A=a1,a2,a3,ap,算法初始从空集 S=开始添加特征。首先,k=1 时,计算 p个特征各自的 Ms值,从 p 个结果中选择拥有最大M 值的特征 am进入空集,得 S=am;接着,k=2 时,第43卷 第3期 2023年6月 制 冷 技 术 Chinese Journal of Refrigeration TechnologyVol.43,
21、No.3 Jun.202360 分别添加剩余的 p-1 个特征进入集合,计算该特征与 S 的 Ms值,从 p-1 个结果中选择有最大 Ms值的特征集合,得 S=am,an;然后继续添加特征,求不同 k 值下的集合 S,直至 k=p;最后找出使 Ms值最大的特征子集 S。2.2 结果分析结果分析 实验获取的数据集拥有 9 个特征,各特征之间的相关性结果如表 2 所示,其中红色代表正相关,蓝色代表负相关。由表 2 可知,即使室内人员是建筑内主要的二氧化碳来源,在该数据集的运算结果中,二氧化碳浓度与室内人数的相关度并不是最高的,这可能受频繁的人员进出和门窗漏风有影响;而室内温度则是由室内空调的设定值
22、决定的,所以室内温度与实际人数相关度不高。表 2 中,室内分贝是相关性最高的特征,图 1 所示为某日 7 时起 36小时室内实际人数与室内分贝变化的对比状况,对比结果表明,室内分贝的变化与室内人数的变化具有高度相关性。表表 2 特征相关性特征相关性 项目 实际人数 PM1 PM2.5 PM10 nCO2 nHCHO nVOC t RH N 实际人数 1.00 0.32 0.26 0.14 0.26 0.22 0.01 0.07 0.30 0.47 PM1 0.42 1.00 0.87 0.90 0.10 0.04 0.06-0.26 0.22 0.35 PM2.5 0.26 0.87 1.00
23、 0.89 0.11 0.06 0.07-0.21 0.27 0.31 PM10 0.14 0.90 0.89 1.00 0.10 0.08 0.06-0.20 0.28 0.27 nCO2 0.63 0.10 0.11 0.10 1.00-0.12 0.11 0.16 0.06-0.07 nHCHO 0.22 0.04 0.06 0.08-0.12 1.00-0.03 0.14 0.29 0.25 nVOC 0.01 0.06 0.07 0.06 0.11-0.03 1.00 0.01 0.05 0.05 t 0.07 -0.26-0.21-0.20 0.16 0.14 0.01 1.00
24、0.03-0.01 RH 0.30 0.22 0.27 0.28 0.06 0.29 0.05 0.03 1.00 0.41 N 0.47 0.35 0.31 0.27-0.07 0.25 0.05-0.01 0.41 1.00 0510152025303502468人数人数时间时间/h(a)人数人数 0510152025303520304050607080分贝分贝(A/B加权加权)/dB时间时间/h(b)分贝分贝 图图 1 室内人数与分贝室内人数与分贝(A/C 加权加权)02468100.30.40.50.60.70.8Ms最大值k 图图 2 不同不同 k 值下值下 Ms值值最大值最大值 表
25、表 3 不同不同 k 值下值下 Ms值最大的值最大的特征集特征集 k 特征集 S 1 N 2 N,nCO2,3 N,nCO2,PM1 4 N,nCO2,PM1,RH 5 N,nCO2,PM1,RH,PM2.5,6 N,nCO2,PM1,RH,PM2.5,nHCHO 7 N,nCO2,PM1,RH,PM2.5,nHCHO,PM10 8 N,nCO2,PM1,RH,PM2.5,nHCHO,PM10,T 9 N,nCO2,PM1,RH,PM2.5,nHCHO,PM10,T,nVOC 第43卷 第3期 2023年6月 制 冷 技 术 Chinese Journal of Refrigeration T
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 传感器 室内 人数 检测 模型
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。