【论文】【PIRATEA】 blockchain-based secure framework of distributed machine learning in 5g networks

PIRATE: A blockchain-based secure framework of distributed machine learning in 5g networks 主要贡献

待解决的问题

5G时代分布式共识协议

共识协议分为2类：竞争类（先附加块再共识–高扩展高分叉）和通信类（先共识再附加块–基于确定性的方式来选择leader）；
分片共识作为一种混合方式得益于通信的即时最终性和竞争的无许可弹性，可以在无许可的区块链中实现可伸缩共识；（RapidChain是一种分片技术）
执行分布式计算时，仅仅依靠诚实行为来评价不足够，因为节点并不能根据诚实行为改变网络环境和计算能力，需要对整个训练过程的可靠性进行一致的评估，在我们的框架中应用一个许可版的分片共识协议。

分布式相比集中式的优点：
1、通信效率：更好利用带宽资源避免交通堵塞，在对等节点之间共享工作负载；
2、成本效率：随着参与者的逐渐增加，单节点维护系统不现实（OPEX）；
3、可靠性：SPOF

LearningChain：利用了区块链来保护梯度聚合和模型参数

贡献：

将梯度和参数存储在链上，利用区块链的可追溯性，恶意节点产生的全局模参可以回滚到出错前的状态（区块链的防篡改特性），
提出的拜占庭容错聚合算法是" l-nearest 梯度聚合"—降低他们生成的恶意梯度对模型聚合的影响；
但其还是master/slaves模式，其参数服务器是通过PoW竞争选举的；
此外因为系统中所有节点都需要保存历史模型参数会导致链上数据过大；
可靠性方面：当连续的两个拜占庭leader共谋时，后续的第三个leader就检测不出来模型污染，问题就出在每次只有一个leader对更新进行校验，当其接受更新时校验立即终止；

梯度的拜占庭保护的研究

传统模型的线性聚合方式不能容忍一个拜占庭节点；
梯度聚合时的两种拜占庭保护方式：
1、基于容错 – 一般只针对IID数据

Krum排除离大多数梯度较远的梯度并基于空间分数选择一个梯度、Multi-Krums取均值加快收缩进度、缺点是时间复杂度O(N2)；
l-nearest基于余弦距离选择 l 个最近的梯度并聚合，时间复杂度O(N)，缺点是不能抵抗无所不知的拜占庭节点（某拜占庭节点获知其他节点的梯度，可伪造出一个满足聚合条件的恶意梯度）；

2、基于检测

Anomaly Detection:由预先训练过的异常检测模型为每个计算节点分配一个信用评分。由于局部梯度的权重是由信用评分决定的，因此加权和聚合可以过滤掉拜占庭式的局部梯度。

3、Learning to learn
将本地梯度更新当作RNN网络的输入，优化一个依赖原始问题轨迹的目标；

PIRATE（分片技术 + 异常梯度检测）【1】准入控制

设备不稳定性要求有实时的可靠性评估来操作准入控制；
提出中心化的准入控制（计算能力、网络环境、加入或离开的可能性、历史诚信分数），一旦授权准入，可通过Bounded Cuckoo rule加入委员会；
训练过程中由委员会验证的分数会被传输进准入控制中心，低信用分节点会被剔除；

【2】去中心化的分片区块链保护机制？？？

【3】对比实验 LearningChain

在通信效率和存储复杂度方面做比对
1、同等迭代比梯度存储量;
2、相同节点数量比迭代次数;