【论文笔记】一些关于区块链的激励系统的论文笔记

A Recommendation Scheme with Reputation-Based Incentive Mechanism on Consortium Blockchain

一、文章主要解决的问题及解决方案:

1)待解决的问题

目前的推荐引擎通常是在集中式服务器上构建的。这种架构容易受到攻击并暴露隐私。因此,需要一种新的去中心化架构模型来解决推荐系统的隐私保护问题。
之前有文章使用了
然而,去中心化推荐系统面临着不主动参与、节点恶意行为等几个问题。这些问题极大地影响了推荐结果的准确性和推荐系统的有效性。因此,本文将设计激励机制,确保参会者推荐的可信性和积极参与性。

2)文章的主要工作

1.提出基于联盟区块链的推荐方案
2.引入了基于声誉的激励机制
3.使用Stackelberg博弈

Stackelberg游戏的以平台为中心的机制假设平台对用户支付的总额拥有绝对控制权,并且用户只能通过调整参与系统的策略来增加收入。

我们的推荐模型类似于Stackelberg博弈模型,但由一个领导者和多个追随者组成。在推荐方案中,系统是领导者,可以制定策略。参与者是追随者,可以作为用户发送推荐请求,也可以根据领导者的策略选择作为推荐人进行推荐。

基于信誉激励机制的联盟区块链推荐方案,利用联盟区块链的可审计性和透明性,提升推荐系统的可信度。

二、系统框架设计

在这里插入图片描述
前期
多个组织可以联合起来构建区块链网络。
在联盟区块链认证和授权后,组织中的参与者可以作为节点加入区块链网络以执行推荐交易。
开始
系统平台将用户提交的任务发布到区块链网络。
信誉激励机制吸引更多节点参与推荐。
当参与节点数超过系统指定的最小数目时,系统将执行建议。
结束
最后,系统将推荐结果返回给用户,并将奖励分发给参与节点。恶意结点将被惩罚。

三、声誉激励机制

激励机制

在这里插入图片描述
R为对所有参与者的总奖励,α为该推荐所需参与节点的阈值,D保证金

节点的声誉评估

为新节点提供存款机制,快速提升信用。存款越多,信用越高。
在这里插入图片描述

奖励分配

推荐方案包含两个角色。一是进行资源推荐的参与者,支付一定的押金Di,完成推荐后获得奖励;另一种是用户,发布推荐并向所有参与者支付一定的奖励R。

可信节点的定义:联盟节点的信誉值T超过信用阈值α,即为可信节点. a
恶意节点的定义:如果一个联盟节点在当前交易后的信誉值T小于恶意阈值(β),则认为该节点为恶意参与者。
在这里插入图片描述

推荐系统的设计和实现

我们将多个教育机构联合起来,成立一个教育联盟区块链。该系统基于Fabric开发环境,操作系统采用Ubuntu 64位系统。前端系统为用户提供与智能合约交互的可视化界面,并通过调用RESTful API与后台进程通信,实现系统功能。

用户分为:普通用户和联合结点用户。

保证金部分一般为未返回保证金,包括未完成推荐任务的保证金和节点恶意推荐扣除的保证金。余额部分是通过推荐获得的奖金。用户会根据参与节点的不同表现,将不同金额的奖励资金转入参与者的余额账户。

在这里插入图片描述

四、安全性和性能分析

反共谋分析

在这里插入图片描述

系统稳健性分析

区块链的优势,不会出现存在这种风险。

性能测试

在这里插入图片描述
从图中可以清楚地看出,引入激励后,每一轮推荐系统的参与者数量显著增加。然后,我们考虑设置阈值的方法,以确保有足够数量的参与者来提高推荐结果的准确性。因此,我们对不同阈值下的推荐结果进行了用户满意度仿真分析。设α为50 70 90。如图6所示,当参与者数量增加时,用户对推荐结果的满意度也会增加,当参与者数量达到阈值时,我们可以获得更准确的推荐结果,从而获得更高的用户满意度。因此,我们在设计激励机制时,需要让参与者的数量超过阈值。

最后,比较了最优推荐激励机制(ORIM)和基于反向拍卖的动态定价机制、虚拟参与信用(RADP-VPC)激励机制和基于声誉的参与式激励机制(RPIM)的系统激励开销。

在这里插入图片描述

勾结情况下的系统激励开销实验结果如图8所示。当存在合谋时,RADP-VPC的系统激励开销迅速增加,说明该机制无法防止恶意合谋。RPIM的制度激励费用增长缓慢而稳定,说明该机制能够在一定程度上保证制度的公平性。ORIM的制度激励费用相对平稳,说明该机制保证了制度的公平性,使制度激励费用保持在较低水平。

Incentive Mechanism for Reliable Federated Learning: A Joint Optimization Approach to Combining Reputation and Contract Theory

我们设计了一个基于声誉的工作者选择方案,通过使用多权重主观逻辑模型来实现可靠的联合学习。利用区块链以分散的方式为具有不可否认性和防篡改属性的员工实现安全的声誉管理。此外,提出了一种有效的激励机制,将声誉与契约理论相结合,以激励具有高质量数据的高信誉移动设备参与模型学习。

为什么需要激励机制?

1.不可靠的工作者可能会执行不良行为,以误导训练。对于有意行为,工作线程可能会发起中毒攻击,发送恶意更新以影响全局模型参数,从而导致当前协作学习机制失败。
2.如果没有精心设计的经济补偿,自私自利的移动设备就不愿意参加模型训练。

系统架构

步骤 1(发布联合学习任务和合同项)
每个任务发布者都会向移动设备广播其具有特定资源要求。满足要求的移动设备可以成为培训辅助角色加入联合学习任务的候选模型,并且还会将包含资源信息的响应反馈给任务发布者。
步骤 2(计算候选人声誉)
步骤 3(为联合学习选择工作人员)
步骤 4(执行联合学习并评估本地模型更新的质量)

声誉设计

在本节中,我们应用一个主观逻辑模型来生成工人候选人的综合声誉价值。

Record and Reward Federated Learning Contributions with Blockchain

存在的问题

虽然联合学习允许参与者在不泄露本地数据的情况下贡献本地数据,但它在数据安全性和准确向参与者支付高质量数据贡献方面存在问题。

解决的问题

没有交易费用的公共区块链,进一步激励用户使用它。

Incentive Mechanism for Reliable Federated Learning: A Joint Optimization Approach to Combining Reputation and Contract Theory

过去的互动中产生的直接声誉意见和其他任务发布者的间接声誉意见被集成到用于工人选择的合成声誉中。

通过Stackelberg博弈的解决方案分析了参与博弈的客户的响应行为,并通过案例研究建立了我们提出的框架的有效性。

猜你喜欢

转载自blog.csdn.net/weixin_45322676/article/details/123747789