分销赏收藏举报申诉 / 18

立即下载开通VIP

当前位置：首页 > 学术论文 > 论文指导/设计 > 基于区块链共识激励机制的新型联邦学习系统.pdf

基于区块链共识激励机制的新型联邦学习系统.pdf

上传人：自信****多点

文档编号：2840725

上传时间：2024-06-07

格式：PDF

页数：18

大小：1.40MB

《基于区块链共识激励机制的新型联邦学习系统.pdf》由会员分享，可在线阅读，更多相关《基于区块链共识激励机制的新型联邦学习系统.pdf（18页珍藏版）》请在咨信网上搜索。

1、第 9 卷第 1 期信息安全学报 Vol.9 No.1 2024 年 1 月 Journal of Cyber Security January 2024 通讯作者:翁渊,Email:。本课题得到中国国家自然基金(No.61903053),重庆市科教委项目(No.KJCX2020033),上海市信息安全综合管理技术重点实验室开放课题(No.AGK2020006)资助。收稿日期:2022-05-05;修改日期:2022-08-20;定稿日期:2023-09-26 基于区块链共识激励机制的新型联邦学习系统米波1,翁渊1,黄大荣1,刘洋1 1重庆交通大学信息科学与工程学院重

2、庆中国 400074 摘要随着云存储、人工智能等技术的发展,数据的价值已获得显著增长。但由于昂贵的通信代价和难以承受的数据泄露风险迫使各机构间产生了“数据孤岛”问题,大量数据无法发挥它的经济价值。虽然将区块链作为承载联邦学习的平台能够在一定程度上解决该问题,但也带来了三个重要的缺陷:1)工作量证明(Proof of Work,POW)、权益证明(Proof of Stake,POS)等共识过程与联邦学习训练过程并无关联,共识将浪费大量算力和带宽;2)节点会因为利益的考量而拒绝或消极参与训练过程,甚至因竞争关系干扰训练过程;3)在公开的环境下,模型训练过程的数据难以溯源,也降低了攻击者的投毒

3、成本。研究发现,不依靠工作量证明、权益证明等传统共识机制而将联邦学习与模型水印技术予以结合来构造全新的共识激励机制,能够很好地避免联邦学习在区块链平台上运用时所产生的算力浪费及奖励不均衡等情况。基于这种共识所设计的区块链系统不仅仍然满足不可篡改、去中心化、49%拜占庭容错等属性,还天然地拥有 49%投毒攻击防御、数据非独立同分布(Not Identically and Independently Distributed,Non-IID)适应以及模型产权保护的能力。实验与论证结果都表明,本文所提出的方案非常适用于非信任的机构间利用大量本地数据进行商业联邦学习的场景,具有较高的实际价值。关键词联

4、邦学习;区块链;共识算法;模型产权保护;投毒攻击中图法分类号 TP309.2 DOI 号 10.19363/J10-1380/tn.2024.01.02 A Novel FL System Based on Consensus Motivated Block-chain MI Bo1,WENG Yuan1,HUANG Darong1,LIU Yang1 1 School of Information and Engineering,Chongqing Jiaotong University,Chongqing 400074,China Abstract With the advancemen

5、t of technologies such as cloud storage and AI(artificial intelligence)in recent years,the value of data has experienced significant growth.However,the exorbitant costs associated with communication and the intolerable risks of data leakage have given rise to a pervasive issue of“data isolation”amon

6、g institutions,rendering a substantial portion of data unable to realize its full economic potential.Although using blockchain as a platform for feder-ated learning can solve this problem to a certain extent,it also brings three primary shortcomings:1)traditional consensus processes like PoW(proof o

7、f work)and PoS(proof of stake)remain largely disconnected from the federated learning training process,resulting in substantial wastage of computational power and bandwidth;2)nodes may decline to partici-pate actively in the training process or even disrupt it due to self-interest considerations,dri

8、ven by competitive dynamics;3)in open environments,data traceability during the model training process is challenging to establish,consequently di-minishing the cost of attack for potential malevolent actors.Our study manifested that,instead of relying on traditional consensus mechanisms such as PoW

9、 and PoS,combining federated learning and model watermarking technology can make the consensus algorithm more fair and reliable.It can avoid the waste of computing power and unbalanced rewards thanks to federated learning,and the innovative consensus mechanism not only retained the properties of imm

10、utability,decentralization,and 49%byzantine fault tolerance but also naturally resisted 49%poisoning attack,adapted Non-IID(not independent and identically distributed)dataset and protected intellectual property.Both experimental and empirical evi-dence unequivocally demonstrate that the proposed so

11、lution in this study is exceptionally well-suited for scenarios involv-ing non-trusting institutions collaboratively leveraging large volumes of local data for commercial federated learning,thereby holding substantial practical value.Key words federated learning;blockchain;consensus algorithm;intell

12、ectual property protection;poison attack 16 Journal of Cyber Security 信息安全学报,2024 年 1 月,第 9 卷,第 1 期 1 引言大数据驱动的人工智能技术有助于在整体上生成高精度泛化模型,但在实际应用过程中却往往存在着数据来源不足的状况1-2。作为一种新兴的机器学习框架,联邦学习(Federated Learning,FL)可以在节点数据孤立的情况下实现分布式模型训练,在一定程度上解决机器学习过程中的数据稀缺问题。此外,由于这种方案3能够在人工智能模型的训练过程中将数据离线,因而也具有数据隐私保护和节省带宽的能力。

13、随着智能边缘设备的普及和性能提升,移动网络的计算能力不断增强,联邦学习在智慧交通4、智慧城市5、商业数据挖掘6-7等领域都得到了广泛的应用。目前联邦学习已经与很多行业相融合,且在区块链、模型水印等技术的促进下不断赋予新的功能8,对实际生活产生了良好的经济效益和社会价值。在信息化时代,大数据背景下的数据隐私问题愈来愈受到人们的关注。由于数据与生活、生产的关联性日益增强,隐私泄露问题必然会遭到社会的广泛抵制,信息价值开发和敏感数据保护之间的矛盾正不断显现9。例如,2020 年 12 月,“明星健康宝照片泄露”事件中大量用户个人数据被非法贩卖,引起我国公安机关的高度警觉和公众的广泛讨论。2017 年

14、 6 月 1 日起实施的中华人民共和国网络安全法指出不得泄露、篡改用户数据,且自 2020 年以来数据安全法、个人信息保护法相继出台,这也充分说明了国家对数据隐私保护的重视。针对机器学习中存在的数据安全风险,学者提出了一系列的隐私保护方案,主要包括联邦学习、多方安全计算(Secure multiparty computation,SMPC)10-11、同态加密(Homomorphic encryption,HE)12-13和差分隐私(Differential privacy,DP)14-15这几类主流技术,其中联邦学习采用的分布式离线训练方法能够在隐私保护的同时有效节省通信及计算资源,非常

15、适用于数据量大、数据源分布广、信息敏感度高的场景。联邦学习的概念最初出现于文献16,逐步演化为纵向联邦学习17、横向联邦学习18和联邦迁移学习19三种基本框架。其中,纵向联邦学习主要适用于参与方数据记录大量重合的场景,而横向联邦学习主要考虑节点间数据特征基本相同的情况,当参与方的样本空间有部分重叠但特征不尽相同时联邦迁移学习则更为适合。在算力不均衡的可信任环境中,上述三类方案往往采用 C/S(客户/服务器,Client/Server)模式予以实现。正是因为充分利用了吞吐量高、性能优异的设备作为中心节点,C/S 模式相较于分布式学习具有训练效率更高、利益分配更均衡、本地数据更安全等优势。然而,在

16、非信任环境下,C/S模式的联邦学习方法极易遭受身份伪造、数据篡改、拒绝服务(Denial of Service,DoS)等攻击的威胁。为解决这些信任问题,文献20提出一种基于区块链的联邦学习方案,将抽象的可信服务节点实例化为分布式的共识激励机制;文献21将联邦学习中的梯度作为一部分贡献,结合 Algorand 共识协议提升了激励的公平性。文献22中通过降低联邦学习中的交互参数以保证用户的匿名性从而降低收到攻击的风险。图 1 展示了基于链上共识的联邦学习整体框架。该框架中的节点可同时或分别扮演数据提供者和区块挖掘者两种角色。所有参与者在本地数据集上完成子模型的训练,随后将其上传至随机选择或投票选

17、举出来的矿工。矿工负责对所有本地模型进行验证与融合,然后根据 PoW 或 PoS 共识机制产生新的区块。这些区块要负责记录矿工的挖矿奖励和数据提供者的贡献奖励,并存储模型更新后的参数。随后,参与者将聚合后的模型再次下载,不断地重复上述过程直至得到满意的全局机器学习模型。由此可见,这种机器学习方法的本质在于间接的数据共享和有效的合作激励,因此共识算法的可靠性和奖励机制的公平性会直接影响整个系统的性能。图 1 基于区块链的联邦学习框架 Figure 1 A federated learning framework based on blockchain 尽管基于共识的联邦学习方法有助于建立起参与节

18、点间的广泛信任,但现有方案仍普遍存在着以下三方面的缺陷:米波等:基于区块链共识激励机制的新型联邦学习系统 17 1)资源浪费问题。文献23指出,将区块链作为联邦学习过程中数据和模型的载体,主要是为了保证相关信息能够被可靠地记录及追溯。然而,由于PoW24、PoS25等“挖矿”行为与联邦学习过程的收敛性并无直接关联,共识机制的引入会直接导致大量算力和带宽被浪费。2)节点活性问题。在实际生产环境中,节点数据和计算资源都是具有一定经济价值的。在某一节点发起联邦学习的模型训练后,其他节点可能会因为利益的考量而拒绝或消极合作,甚至会因为竞争关系投入虚假数据对模型进行干扰,最终导致全局模型无法使用或训练

19、过程无法收敛。3)攻击手段的多样性问题。尽管联邦学习领域正不断引入各种新的机制来对抗日益多样化的攻击手段,但大都针对片面的安全目标26。与传统机器学习所面临的威胁类似,模型攻击27、投毒攻击28、后门攻击29、推理攻击30等方法在联邦学习中也主要是对数据隐私和全局模型进行破坏。事实上,联邦学习在一定程度上具有数据隐私保护的特性。因此,安全机制的实现不应当以攻击手段为驱动,而需要将数据保密性和模型准确性作为根本目的。联邦学习的商业场景往往具有参与节点数量少、合作关系松散耦合的特点。此外,非信任分布式环境的物理脆弱性和攻击来源的多样性极有可带来节点丢失、数据污染、模型篡改等隐患,从而导致训练过程因

20、无法准确收敛而失败。为此,本文将针对节点数量有限、数据吞吐量大、互信程度低的跨企业分布式场景,结合区块链及水印技术来构造一种全新的共识激励机制,从而解决联邦学习中算力浪费、奖励不均以及鲁棒性弱的问题。总体而言,其基本思想是借助区块链的一致性记录能力以及模型水印的版权保护机制,将模型训练分发到多个节点上并行执行,每轮结束后多个矿工将分别对收集到的本地模型进行聚合,并根据评价准则在链上达成模型准确度和参与者贡献度的共识,由此产生新的区块,不断迭代直至获得期望的全局模型。在具体的实施过程中,参与训练的节点会将自身的水印嵌入到梯度模型中用于证明所做出的贡献。为了争夺写入权限,所有融合节点将利用所接收到

21、的梯度构造一个能够让大多数节点都认可的全局模型。最终,达成共识的全局模型将会由它的创造者写入区块。基于上述策略,本文将 Paxos 共识协议31中的投票理念与联邦学习相结合,构造出一种新型共识协议 Paxos Federated Consensue(PFconsensue),并通过高鲁棒性水印融合算法的设计,最终形成一套可证明完备的联邦学习共识激励机制。本文的贡献主要在以下几个方面:1)基于联邦学习的共识协议。将联邦学习的训练过程作为节点“挖矿”环节,使消耗的资源转换成具有经济价值的人工智能模型。同时,模型聚合采用去中心化与性能投票的方式进行,克服了联邦学习中 Non-IID32与投毒攻击所造

22、成的全局模型性能下降的缺点,实现了联邦学习与区块链技术的优势互补。2)公平的区块链共识激励机制。为提高联合训练的参与度,依靠高鲁棒性模型水印技术和参数距离算法,实现了公平的节点贡献度分配,可以更好地刺激节点参与模型训练过程。在模型聚合环节,将区块的写入权奖励给最优模型的创造者,也能够充分地保证节点积极参与模型聚合。可见,该区块链系统在本地训练和模型聚合两方面均保证了参与节点的活性。3)系统的整体完备性证明。从理论上了证明了共识算法的正确性,并通过形式化方式分析了共识算法在拜占庭环境下的容错能力。同时,通过实际数据的分布情况抽象出相应的约束条件,分别讨论了该系统组成部分在实际环境中运行的有效性与

23、稳定性。此外,对系统的整体安全性也进行了充分的证明。4)实验仿真及分析。利用计算机模拟验证了共识协议的有效性。根据实际采集的“重庆市实时交通流”数据在多台设备间部署共识决策环境,验证了本方案在现实环境中的可行性及准确性。此外,基于系统性的区块链仿真,进一步展示了本方案对联邦学习中潜在威胁的抵抗力。2 系统整体模型由于区块链具有不可篡改、易追溯和去中心化等优势,与联邦学习相结合能够极大程度地克服联邦学习中所潜在的风险。对此,本章节将基于PFconsensue 协议、模型水印等技术构造整体的区块链系统,并给出实际环境中的安全性形式化定义。2.1 系统框架设计当前已有部分研究人员将区块链用于解决

24、联邦学习在非信任环境中的安全协同训练问题。文献33中选取区块链上的可靠节点来参与联邦学习,并通过差分隐私技术以保证训练数据的安全。文献34则将联邦学习过程中的全局数据组织成“全局模型状态树”,作为交易内容存储到区块链中。而文献35也类似地利用区块链存储联邦学习过程中的各种模型参数,该方案还可以借助其他边缘设备来分担训18 Journal of Cyber Security 信息安全学报,2024 年 1 月,第 9 卷,第 1 期练能耗。然而,由于以上方案皆未考虑模型所具有的知识产权特性,可能产生模型盗用现象,也将导致参与方发生产权纠纷。另一方面,依附于区块链的联邦学习会因为共识过程而造成大

25、量的资源浪费,导致节点参与度下降。为了解决上述两个问题,本文设计了图 2 所示的联邦区块链结构。在该结构中,链上记录的数据主要包括:(1)上一个区块的 Hash;(2)融合后的模型参数;(3)构造融合模型所使用的局部梯度集合;(4)基于评价准则的产权奖励;(5)下一轮训练的优化目标。图 2 本文区块链系统结构 Figure 2 The structure of the blockchain system in this paper 在协议开始时,参与节点将会从区块链上获取公开发布的初始模型及训练目标,并在本地训练出包含水印的梯度模型。随后,节点会将梯度模型通过Gossip 协议36进行广播,并

26、在收到足够的梯度信息后尝试通过聚合算法得到聚合模型。最后,聚合模型会传送至各个节点进行评测,投票产生的最优模型和下一轮协议的优化目标将被同时写入新的区块。考虑到数据的防篡改问题,除分布式存储外还将借助Hash链式结构和最长链原则37来确保区块链的持久性。值得一提的是,本方案在设计区块数据结构时将各个节点的梯度模型一并记录在区块上,这样可以确保聚合模型的可信度。就节点活性而言,由于区块链上的聚合模型保留有各参与方的梯度模型水印,他们可以据此对调用该模型的第三方收取知识产权费。与此同时,高鲁棒水印融合技术的使用还能够有效防止公开模型被盗用。可见,该方案能够充分激励各个节点参与联邦学习过程。更进一步

27、地,本文对上述区块链的整体构架进行如图 3 所示的逻辑刻画和分层设计。节点之间主要负责构造区块链数据服务,而第三方只需通过API 接口发布模型需求或对模型进行调用。图 3 本文区块链框架设计 Figure 3 The blockchain framework of this paper 米波等:基于区块链共识激励机制的新型联邦学习系统 19 2.2 攻击模型及安全定义区块链能够解决联邦学习的中心化问题,联邦学习则实现了区块链上的数据隐私保护。为确保本文设计的方案能够可靠运行,首先对其性能与安全进行形式化定义,后面章节也将围绕这些定义进行阐述及论证。本文提出的联邦学习共识算法PFconsen

28、sus主要用于解决分布式环境下的数据一致性问题。PFconsensus 协议的攻击环境和安全性定义如下。定义定义 1.拜占庭攻击环境.设参与第 j 轮共识的节点集合为j?,对jk ,k 具有概率多项式时间(probabilistic poly-nomial-time,PPT)的计算能力,且拥有所有节点的数字签名验签密钥集合|ijPKpki i,用于验证其他节点传输数据的真实性。节点 k 自己上传的梯度模型kW具有以下特征:1.梯度模型kW本身需满足水印验证,wkVW,kkBTrue;2.聚合节点d在融合过程中利用kW所得到的聚合模型dN能够通过水印验证,即,wdVN,kkB

29、True;3.如果聚合节点d在融合过程中未利用kW,那么所得到的全局dN不能满足水印校验,即wV,dkkBFalseN;在攻击环境下存在着部分拜占庭节点,本文记这些节点所构成的集合为,对任意a,它具有伪造该集合中其他节点数字签名和模型水印的能力,并可能发起选择性通信、延时通信、通信乱码等攻击。而对于诚实节点jc而言,它们将按照PFconsensus协议正常运行,且在联合训练期间一直在线,不存在延时通信、通信乱码的情况。定义定义 2.待融合梯度模型.记正常传输梯度模型所需的时间为wt,节点k训练梯度模型的耗时为trainkt,进行模型聚合的耗时为avgkt。在n个参与节点中选取m个梯度模型进行融

30、合,要求其执行过程满足以下条件:0ntrainktrainkttn;(1)max()trainwtrainkttmt;(2)trainwavgttt;(3)20()0navgavgkkttn。(4)这四个条件能够保证在拜占庭环境下至少存在一个诚实节点正确地执行共识,从而避免因性能差异或共谋等原因将所有诚实节点排除在共识过程之外。其中,式(2)能够保证诚实节点在承诺打分阶段至少接收到m个正确的梯度模型,而式(3)保证了聚合后的模型集合中必然包含一个正常的聚合模型。具体分析将在后面给出。定义定义 3.拜占庭环境下共识协议的安全性.在攻击环境下满足以下两个条件则表明共识协议是安全的,其中()Card

31、表示集合中的元素个数:(1)当()()/2jCardCard时,PFconsensus协议能够完成;(2)当()()/2jCardCard时,非拜占庭节点能够得到相同的结果。本文将联邦学习算法作为模型训练的基本框架,但为保证去中心化后仍然能够正常工作,还需考虑如下额外因素及需求。定义定义 4.投毒攻击节点.对于去中心化环境中的拜占庭节点k,它能够发布恶意梯度kW,使任意聚合了kW的聚合模型N 性能下降。定义定义 5.去中心化环境中联邦学习算法的有效性.针对区块链上联邦学习算法的有效性问题,本文方案需满足以下性质:(1)当()()jCardCardm时,最终上链的聚合模型以可忽略的概率包含投毒梯

32、度模型(其中m为常数);(2)最终上链的聚合模型与中心化联邦学习方案在准确性方面的差异可忽略。最后,对区块链的整体安全性做如下定义:定义定义 6.拜占庭环境下区块链的整体安全性.(1)当()()/2jCardCard时,区块链上的数据被拜占庭节点所篡改的概率可忽略;(2)基于区块链的联邦学习共识激励机制对于任意拜占庭节点k,盗取其他诚实节点贡献度的概率可忽略。3 基于区块链的联邦学习共识激励机制针对上述对拜占庭攻击环境的定义,本章节将先引入模型水印技术来保证联邦学习过程中的模型产权证明。进一步的,将详细介绍PFconsensue协议20 Journal of Cyber Security 信

33、息安全学报,2024 年 1 月,第 9 卷,第 1 期的运行过程。最终,通过上链模型数据和模型水印设计了一种公平的激励机制。该机制能够在保证节点数据隐私的同时维持参与节点的训练积极性。3.1 FedIPR 模型水印在设计PFconsensue共识算法时,需确保网络中数据传输的可靠性,并维护模型版权对融合过程的鲁棒性,为此需要构造适应的数字签名和模型水印方案。由于在共识激励的过程中需要对联邦学习产生的梯度模型进行交叉验证,本文考虑结合FedIPR模型水印与数字签名算法来保证模型的唯一性。此外,在对聚合模型进行产权证明时,FedIPR算法也能提供一个可信的结果来保证激励机制的公平。FedIP

34、R算法最初由Fan等人38提出,它能够通过调整模型的目标函数,同时植入白盒水印与黑盒水印,本文构造类似的水印植入过程如下:(1)对于节点1,.,kK,其密钥生成算法为:(),kkkI IBT,其中白盒水印部分的签名内容为kB,签名提取参数为,kkkSE,而黑盒水印的后门数据集为11,.,kJJX YXYT,X和Y分别表示后门数据的特征及标签。(2)节点k对联邦模型进行训练的过程中将后门kT 及签名kB加入其目标函数:trigger signfeature signmian task,()()(),kkkktttDkkTkkBkOptLLR WWW (5)则,对于节点在第t轮的梯度计算过程将按照

35、公式1(,)ttCilentUpdata nLWWW。(3)模型聚合算法将采用梯度平均策略(Federated Averaging):111=Kttkkknn，WW (6)其中,1(,)ttkCilentUpdate nWW。模型验证包括黑盒与白盒两种方式。就白盒水印而言,若节点k需证明其对聚合模型的贡献,可以通过提取算法(),)kkkBMLsign SEW从聚合模型N的权值中恢复出近似签名信息kB,之后通过汉明算法(,)kkH BB计算kB与kB之间的距离,并通过判断距离大小来证明其知识产权的有效性,即 if(,),otherwisekkHwkkTrueH BBV

36、WBFalse，。(7)而对于节点k植入的黑盒水印,它可以通过将后门数据kT输入模型N并判断输出的准确性来予以证明:if(),otherwisenTjiyBkTrueEI YXVFalse，NN T。(8)上述算法的正确性与鲁棒性已经在文献38中得到了验证。本文中实验也表明该算法在分布式联邦学习环境下具有很好的鲁棒性,能够满足定义1中对签名算法的要求。为保证模型在传输过程中的真实性并降低其通信轮数,本方案也将使用数字签名算法来进行可靠的数据传输。对于任意节点jk,传输消息0,1nm 时,将同时计算(,()Sign sk Hash m,最终打包得到(,)m,并将其发送到目标节点。3.2 PFco

37、nsensus 联邦共识算法最早提出的联邦学习算法是一种基于C/S框架的中心化服务,每个用户需要传输各自的梯度模型给服务器,而服务器会利用他们的梯度模型进行聚合并返回给客户端进行迭代训练。该结构极易导致拒绝服务攻击,因而有学者通过结合区块链中的智能合约,将其改造为去中心化方案。为避免无谓的能耗,本文将联邦学习算法本身作为共识,并结合区块链与水印技术在一定程度上解决联邦学习中的Non-IID及投毒问题。该算法的核心在于通过对比聚合模型的性能来达成一致,主要可以概括为模型性能筛选和共识写入两个部分。本文将参与共识过程的角色分为三种:pro-poser、acceptor以及learner(acce

38、ptor和learner的角色互斥)。其中,proposer是数据的产生和发送者,acceptor表示数据的接收者和模型性能的裁决者,learner作为数据的最终写入者。1)模型筛选阶段:a.本地模型训练:proposer会发布模型的基本结构,并初始化参数。随后,acceptor会利用本地数据对proposer的初始模型进行训练并在植入模型水印后将其广播。b.模型聚合:proposer在收集到梯度模型后,利用Federated Averaging算法对模型进行聚合并微调,得到聚合模型后将其广播。c.模型打分承诺:此时acceptor集合中的成员会对得到的聚合模型进行准确性验证,将第一个收到的

39、模型标记为kN,而随后的模型标记为aN,其中a表示该模型的发布者。按接收到的顺序对比kN与aN的性能,如果aN性能较好则计算承诺(,)akvoteN,同时不再接收性能小于aN的模型,并米波等:基于区块链共识激励机制的新型联邦学习系统 21 令kaNN;否则向a返回消息(,)kkN。d.优秀模型筛选:proposer a在收到(,)kkN后也会将自己的模型aN和kN进行对比,若kN性能优于aN,则令akNN,并向kN模型的生成者返回承诺(,)kavoteN。2)共识阶段:e.共识请求:当proposer收到一半以上对聚合模型N的承诺后,便开始广播包含N哈希值的一致性消息m

40、essage。f.共识认定:acceptor在收到了proposer的message数据后,对比自己的kN是否等于N,如果是则转换为learner成员从而退出模型打分承诺阶段,广播(,)kmessage revotes;否则,不回复。g.区块写入:当learner收到(,)imessage revotes消息后,核对其中相同的message是否已经超过了总节点数量的1/2,若是,则将写入区块,同时广播(,)end message;在收到全体成员1/2以上的(,)imessage revotes后,如果相同的message未超过总体成员的1/2,那么该learner将撤回其lea

41、rner身份,从新转换成acceptor。h.协议结束:当learner收到(,)end message时,本轮协议结束。本文所提出的PFconsensus协议利用了聚合模型的性能优劣来选取最终的共识内容,聚合过程的随机性与模型性能的有界性使得一段时间内只存在一个proposer。相比于原始paxos协议中产生多个proposer的现象,本文方案避免了活锁的出现。此外,在保证去中心化特性的同时,该算法也高效地利用了分布式设备的资源来优化训练及验证过程。各个节点利用本地数据集对聚合模型进行性能评测的方式,促使被投毒、普适性弱的聚合模型难以被大多节点所接受,在一定程度上解决了Non-IID问题及模

42、型投毒问题。以上述方案为基础,下面进一步对PFconsensus协议在区块链环境中的实现进行了更为详细的设计。首先,为了保证PFconsensus正常运行,需根据区块链应用的实际情况定义以下函数(1表示是,0表示否):(,)kkinitkTrainIDWW:表示节点k利用本地数据对发布的初始模型进行训练,并通过FedIPR算法嵌入模型水印;(,)kkkFedAvgIDN:表示节点k从待选梯度集合k中随机选择m个及以上模型,并通过联邦聚合算法得到聚合模型kN;0 or 1(,)kkVSW:表示验证kW的水印和数字签名是否同时合法;0 or 1()kiFCW:表示节点k的待选梯度集合k中是否包含节

43、点i的梯度模型;0 or 1(,)iiVN:验证由节点i产生的iN是否聚合了m个以上的梯度模型,以及数字签名和模型水印签名是否能够通过验证;Gossip()message:表示利用Gossip协议广播消息message;()kiAppend W:表示节点k在他的待选梯度集合k中添加iW;根据PFconsensus协议,区块链的运行主要包括模型生成和竞争写入算法两个部分。首先对模型的生成算法进行设计:算法算法 1.1jBlock上的模型训练与模型聚合算法。定义第j个区块为jBlock,本轮参与节点所构成的集合记为1j,每一个节点都有各自的签名密钥对,jinitW为本轮优化目标的模型初始权值。输入

44、:jBlock,1j,jinitW,各个节点的密钥对。输出:聚合模型N。1 FOR 1jk:2 训练,jkkinitkTrainIDWW;3 计算,kkkSign skW;4 运行Gossip,kkW;5 定义0num;6 当k节点收到i节点的,iiW时:7 IF,iiVSW为 1:8 则kiAppendW;9 IF kiFCW为 0:10 则 1num num;11 IF numm:12 计算,kkkFedAvgIDN;13 计算,kkkSign skN;14 运行Gossip,kkN;15 END FOR 在梯度模型生成后,各个节点需要对网络中的聚合模型进行评价,并筛选出全局性能最好的模型

45、。22 Journal of Cyber Security 信息安全学报,2024 年 1 月,第 9 卷,第 1 期最终,生成该最优聚合模型的节点将指定下一轮协议的模型初始参数。算法 2a、2b 将具体描述如何实现筛选并达成共识。算法算法 2a.模型评价及写入权限争夺。定义由节点k生成的聚合模型为kN,集合1j中共有G个节点。所有 proposer 节点构成集合1j的子集1j,而 learner 组成的集合记为1j,显然1j与1j的交集为空。输入:kN,1j,1j。1 FOR 1jk:2 令kkBNN;3 0votes;4 当收到i节点的,iiW时:5 IF,iiVN和,kiContBNN

46、均 1:6 令kiBNN,并发送kvote给i;7 当收到i节点的ivote时:8 1votesvotes;9 IF/2votesG:10 构造下一轮模型初始权值1jinitW;11 计算1,(,)jkkkinitSign skNW;12 令1,jkkinitkmessages NW;13 运行Gossipkmessages;14 当收到i节点的imessage时:15 IF 1ikiV messages且BNN:16 离开组群1j,加入1j;17 运行Gossipirevote;18END FOR 算法 2a 表明当节点作为一个 proposer 时,会进行对聚合模型的评价并争夺区块的写入权

47、限。算法2a 可以与算法 1 在节点k上并发执行,当 proposer在算法 2a 中转换为 learner 角色后,将停止执行这两个,其目的在于确保模型数据写入区块时唯一。算法算法 2b.共识及区块写入算法。输入:1j。1 FOR 1jk:2 在本地初始化所有 0irevotes;3 当收到对i节点的认定irevotes:4 1iirevotesrevotes;5 IF/2irevotesG:6 令endimessagesmessages;7 运行Gossipendmessages;8 END FOR 算法 2b 的目的是确定大多数节点皆认为是最优模型并已做好写入区块链中的准备。从算法 2

48、a、2b可以发现,若节点由proposer转化成learner角色,将会失去发布新模型和竞争写入权限的能力,可能因时延而导致模型无法得到一半以上节点的认定,从而协议失败。为此,需要设计活性算法以解决该问题。算法算法 3.活性算法。输入:1j,1j。1 FOR 1jk:2 令0revotes;3 FOR 1ji:4 计算irevotesrevotesrevotes;5 END FOR 6 IF/2irevotesG且/2revotesG:7 则离开组群1j,加入1j;8 END FOR 当节点转换成一个learner角色后将运行算法3,这可以防止由于大部分节点被激发成为learner后所出现的死

49、锁现象。3.3 参与者贡献度评价算法通常评价联邦学习中梯度模型对最终模型的贡献度时,往往会将其梯度模型从最终模型中剔除,将剔除后模型在测试集上的性能差异作为贡献值。然而,由于在分布式的竞争环境下往往不存在普遍认可的测试集,因此本文将设计一种利用梯度模型和最终模型参数距离来换算贡献度的方法。该方法能够在各节点数据隐私得到保护的同时获取一个令人信服的贡献度指标。记聚合模型为endN,聚合方式采用Federated Averaging算法:1,KkendkKnnNW (9)其中,(,)kCilentUpdate nWW。那么评价一个梯度模型kW的贡献程度kC需要米波等:基于区块链共识激励机制的新

50、型联邦学习系统 23 采用以下两个步骤:,endkkendkNWNW (10)0kkniiC。(11)通过计算聚合模型和不同梯度模型之间的夹角大小即可衡量它对整体的贡献度。4 系统正确性及安全性分析如果上文所设计的系统能够满足2.2节中所给出的安全性和有效性定义,则说明本文的整体系统在实际运行中是安全有效的。在本章节中,将先结合共识协议的活性对第三章中所设计的PFconsensus协议进行正确性分析。此后,将围绕2.2节中的攻击模型和安全性定义对本文所设计的区块链系统进行安全性和有效性的形式化证明。4.1 PFconsensus 协议正确性分析 PFconsensus协议在本质上是基于聚合模

下载提示：咨信网仅提供存储空间/不修改/不编辑

【自信AI创作助手】【自信AI导航】
1、请仔细预览页面，基本判断完整性，对于直接下载带来的问题请及时与客服沟通；下载的文档，不会出现我们的网址水印。
2、该文档所得收入（下载+内容+预览）归上传者、原创作者；如果您是本文档原作者，请点此认领！既往收益都归您。

同意并开始全文预览

举报此文档有问题？有机会获“体验VIP”奖励！

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

10 金币 0人已下载

申诉本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请申请举报、认领或删除 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 基于区块共识激励机制新型联邦学习系统

咨信网温馨提示：
1、咨信平台为文档C2C交易模式，即用户上传的文档直接被用户下载，收益归上传人（含作者）所有；本站仅是提供信息存储空间和展示预览，仅对用户上传内容的表现方式做保护处理，对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿，我们不确定上传用户享有完全著作权，根据《信息网络传播权保护条例》，如果侵犯了您的版权、权益或隐私，请联系我们，核实后会尽快下架及时删除，并可随时和客服了解处理情况，尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确)，网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据，平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺，下载前须认真查看，确认无误后再购买，务必慎重购买；若有违法违纪将进行移交司法处理，若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传，付费前请自行鉴别，如您付费，意味着您已接受本站规则且自行承担风险，本站不进行额外附加服务，虚拟产品一经售出概不退款（未进行购买下载可退充值款），文档一经付费（服务费）、不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印，是因预览和防盗链等技术需要对页面进行转换压缩成图而已，我们并不对上传的文档进行任何编辑或修改，文档下载后都不会有水印标识（原文档上传前个别存留的除外），下载后原文更清晰；试题试卷类文档，如果标题没有明确说明有答案则都视为没有答案，请知晓；PPT和DOC文档可被视为“模板”，允许上传人保留章节、目录结构的情况下删减部份的内容；PDF文档不管是原文档转换或图片扫描而得，本站不作要求视为允许，下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权，请谨慎使用；网站提供的党政主题相关内容(国旗、国徽、党徽－－等)目的在于配合国家政策宣传，仅限个人学习分享使用，禁止用于任何广告和商用目的。
6、文档遇到问题，请及时私信或留言给本站上传会员【自信****多点】，需本站解决可联系【微信客服】、【 QQ客服】，若有其他问题请点击或扫码反馈【服务填表】；文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“【版权申诉】”（推荐），意见反馈和侵权处理邮箱：1219186828@qq.com；也可以拔打客服电话：4008-655-100；投诉/维权电话：4009-655-100。