在2024年10月14日至18日于美国犹他州盐湖城举行的第31届ACM计算机与通信安全大会(The 31st ACM Conference on Computer and Communications Security,简称CCS)上,数据科学重点实验室成员韩伟力教授领导的团队取得了显著成就。他们的科研成果《Ents: An Efficient Three-party Training Framework for Decision Trees by Communication Optimization》荣获了本次会议的Distinguished Artifact Award。
01
论文概述
随着全球范围内隐私保护法律法规的不断加强,个人隐私保护已成为至关重要的议题。例如我国自2021年11月1日起正式实施的《中华人民共和国个人信息保护法》对公民个人敏感隐私信息的保护提出了强制性要求。在此背景下,安全多方决策树训练框架因其可证明安全以及模型的可解释性强的特点在金融风控、精准医疗等领域展现出巨大的应用潜力。
尽管如此,现有的安全多方决策树训练框架因为其高昂的通信成本,几乎无法被应用到实际场景中。这种高昂的通信成本主要来源于两个原因:(1)无法高效且安全地对数据集进行分割。(2)几乎所有的计算都在大的环上进行以支持基尼系数等分割指标的安全计算。
韩伟力教授团队在论文中提出的安全多方决策树训练框架Ents通过以下两个技术手段显著降低了通信成本:(1)设计了基于安全基数排序协议的决策树训练协议从而高效且安全地对数据集进行分割。(2)设计了高效的环环转化协议,使得只有在计算基尼系数时才在大环上进行,其他计算都在小环上进行。
实验结果表明,Ents框架在保持与明文训练相当精度的同时,相较于现有的安全多方决策树训练框架,能够节省高达80%~90%的通信成本,并在训练速度上实现了6倍以上的提升。特别是在三方场景和WAN网络环境下(5MBps,40ms RTT),Ents能够在三小时内完成对样本数量超过245,000的数据集的训练。这一成果标志着Ents框架已达到实用化水平,为安全多方学习的广泛应用奠定了坚实基础。
02
安全多方学习平台Garnet
Ents框架及其扩展的安全多方XGBoost训练框架均已开源在Garnet平台中。Garnet是复旦大学韩伟力教授团队开发并开源的一个安全多方学习平台,它深度优化并扩展自MP-SPDZ(CCS 2020),并针对安全多方学习的特定功能需求进行了适配。经过多轮迭代,Garnet已具备易用性高、通用性强且支持算法丰富的特点。Garnet开源地址为:
https://github.com/FudanMPL/Garnet
03
会议简介
ACM CCS与IEEE S&P、USENIX Security、NDSS并称为网络与信息安全领域的四大顶级学术会议,也是中国计算机学会(CCF)推荐的A类会议。这些会议代表了该领域的最高学术水平,是全球研究人员交流最新研究成果的重要平台。
04
结 语
我们再次向韩伟力教授及其团队表示热烈的祝贺,并期待他们未来在计算机和通信安全领域取得更多突破性成果,为该领域的进步做出更大贡献。