本方案充分利用了
区块链的技术优势,在运营商、公安部门等多方数据的支撑下,发挥跨行业数据融合和模型共享能力,结合
联盟链防篡改、可追溯的关键特性,将联邦建模的模型关键参数上链,实现智能反诈。
方案原理
本文重点针对运营商反诈识别的联邦模型训练流程实现能力优化,方案思路主要是:联邦参与方进行数据特征提取和本地模型训练,模型参数通过区块链上链服务进行数据上链,经过CMBaaS的智能合约判断,并通过区块链共识算法计算后,生成新的区块。其他参与方的区块消费服务检测发现新区块生成,获取区块数据后进行自己模型的参数迭代优化,更新参数,直到所有联邦参与方均达到模型预设收敛条件。
方案创新点是:在多方共同参与模型训练后,引入区块链智能合约技术,对多方数据进行统一管理,以区块链代替联邦模型的中心节点,解决了联邦学习的中心节点审计问题。系统使用的区块链底链类型为EOS,主要承载方为中国移动CMBaaS区块链平台。
基于区块链的中国移动反诈识别模型机制方案主要流程包括:区块链替代联邦学习中间方实现数据融通、合作、可信,模型训练过程中梯度的中间结果加密上链,由区块链进行结果解密,再将总梯度聚合,并下发给各参与方,完成参与方数据不出库的联合建模。
与区块链结合有助于判定联邦学习各方贡献度,因为多参与方模型特征变量IV值在进行数据上链时,均会在区块链平台生成一个永久不可逆的数据区块。因此,可以此计算当前参与方本次上链对整体模型的贡献度,在模型收敛后,对全部参与方的贡献度进行量化判断,为联邦参与方的合作提供谈判依据。
在多个参与方进行联邦推理时,区块链用于记录用户服务的接口调用日志指纹、各参与方的贡献度、该服务所产生的收益,并通过智能合约自动将收益分配给各参与方。与现有的按条计费不同,这种方式可以更精准地评估每次数据调用的质量,从而激励参与方确保数据调用的准确性。
系统架构及组网
基于区块链的电信反诈系统具有较高的技术价值,可以解决运营商跨行业数据融通的实际问题。中国移动跨行业数据融通的反诈系统技术架构如图3所示,包括企业数据层、联邦参与服务层、区块服务层、共享数据区块平台层。
企业数据层:中国移动及合作伙伴的用户隐私数据依然只存储于各自的内网系统中,训练及推理请求均由内网应用发起。
联邦参与方服务层:中国移动及合作伙伴分别构建一套本地AI模型,将模型参数和数据标识提供给区块服务层进行数据上链,并接收其他参与方的模型数据,同步推进数据共享模型迭代升级。
区块服务层:作为AI模型与区块链CMBaaS平台的中间服务节点,提供定制化数据上链及数据消费的服务。
共享数据区块平台层:即中国移动区块链服务CMBaaS平台,通过智能合约及共识机制为整个系统提供不可逆、互信的模型共享训练平台。
该系统主要有数据对齐、模型训练、模型推理3个数据流。
数据对齐:在模型开始训练之前,各参与方需要共享加密后的用户ID数据,同步给其他参与方进行数据对齐。
模型训练:联邦参与方进行数据特征提取和本地模型训练,模型参数通过区块链上链服务进行数据上链,经过CMBaaS的智能合约判断,且通过区块链共识算法计算后,生成新的区块。其他参与方的区块消费服务检测到新区块生成,并获取区块数据后,进行自己模型的参数迭代更新,直到所有联邦参与方均达到模型预设收敛条件。
模型推理:中国移动及合作伙伴发起模型推理请求,区块服务进行数据上链,通过智能合约及共识算法进行数据验证并生成区块,其他参与方监测新区块生成,判断推理请求是否与自身相关,再进行共同推理解密,最后请求方获得模型推理结果,返回业务系统。中国移动跨行业数据融通的反诈系统的逻辑流程如图4所示。
应用实例
目前,电信反诈识别系统在
天津移动资源池、中国移动CMBaaS区块链平台完成部署;同时,天津移动和渤海银行、天津市公安局合作完成联合建模,并持续基于需求提升系统功能。
版权申明:本内容来自于互联网,属第三方汇集推荐平台。本文的版权归原作者所有,文章言论不代表链门户的观点,链门户不承担任何法律责任。如有侵权请联系QQ:3341927519进行反馈。