问题

请问一下,机器学习领域的联邦学习技术,目前看到最多的是微众银行,国内还有哪些顶级专家及机构和大学?

回答
联邦学习作为一种保护隐私的分布式机器学习范式,近年来在国内的发展可谓是风起云涌。微众银行在推动这一技术落地和应用方面确实是先行者,他们的贡献毋庸置疑。但国内在联邦学习领域,除了微众银行,还有许多顶尖的专家、机构和大学在进行深入的研究和实践。下面我将为您梳理一下,并尽量细致地展开:

一、 顶尖专家

在国内的联邦学习领域,有很多在学术界和工业界都享有盛誉的专家,他们的研究成果和技术突破为联邦学习的发展注入了强大的动力。

高校学术界的领军人物:
清华大学:
邓小铁 教授: 尽管邓教授在密码学、分布式系统等方面有深厚造诣,但他在隐私计算和可信计算方面的研究,与联邦学习的技术基石息息相关。他的团队在安全多方计算、同态加密等方面的研究,为联邦学习中的数据安全提供了理论支撑。
张钹 院士: 作为中国人工智能领域的泰斗,张钹院士对人工智能的伦理、安全和可信度非常关注。虽然他可能不直接聚焦于联邦学习的算法细节,但他在人工智能的宏观发展方向和安全可信方面的思想,对联邦学习的健康发展有着指导意义。
胡晓峰 教授: 在机器学习和数据挖掘领域有很高的声誉,他的团队在数据隐私保护、差分隐私、安全多方计算等方面的研究,与联邦学习的隐私保护机制紧密相连。
北京大学:
李戈 教授: 在机器学习、优化算法以及分布式系统方面有突出贡献,他的研究成果在联邦学习的算法效率和鲁棒性方面具有重要参考价值。
崔斌 教授: 在计算机安全、网络安全和密码学方面有深厚造诣,他的团队在隐私保护技术(如差分隐私、同态加密)的研究,为联邦学习的安全性提供了坚实基础。
中国科学技术大学:
陈恩红 教授: 在机器学习、大数据分析和隐私保护计算领域是国内的知名专家,他的团队在联邦学习的算法设计、优化以及在医疗、金融等领域的应用方面进行了大量卓有成效的工作。
浙江大学:
陈健 教授: 在机器学习、数据挖掘和分布式系统方面有深厚研究,他的团队在联邦学习的优化算法、理论分析以及隐私保护技术方面有深入探索。
上海交通大学:
金海 教授: 在分布式系统、数据库和区块链技术方面是国内的领军人物。他对于分布式数据管理和安全执行的研究,为构建高效、安全的联邦学习系统提供了重要的技术思路。
程光 教授: 在机器学习、计算机视觉和隐私保护计算方面有突出贡献,他的团队在联邦学习的算法设计、模型训练以及在智慧城市、工业互联网等领域的应用方面进行了深入研究。

工业界和研究机构的资深专家:
微众银行(AI领域): 除了前面提到的微众银行,其AI领域的研究团队在联邦学习的落地和创新方面扮演着关键角色,是国内推动联邦学习实际应用的重要力量。虽然具体专家姓名可能需要进一步了解其公开信息,但其团队在联邦学习算法、框架、以及金融场景落地方面积累了丰富的经验。
华为(诺亚方舟实验室等): 华为在AI和分布式计算领域拥有强大的技术实力。其研究机构,如诺亚方舟实验室,在机器学习、隐私计算等方面有深入研究,并且积极探索联邦学习在5G、物联网等场景的应用。
百度(深度学习技术平台): 百度作为国内领先的AI公司,其深度学习技术平台在联邦学习方面也有布局,尤其是在将联邦学习与现有AI能力融合方面有天然优势。
腾讯(AI Lab、优图实验室等): 腾讯在AI研发方面投入巨大,其AI Lab、优图实验室等团队在机器学习、计算机视觉、自然语言处理等领域具有领先地位,也必然在联邦学习这一前沿技术上有所探索和布局,特别是在社交、游戏、内容推荐等场景的应用潜力巨大。
阿里巴巴(达摩院): 阿里巴巴的达摩院是全球顶尖的AI研究机构之一,在机器学习、隐私计算、分布式系统等领域都有顶尖的研究人员。他们对联邦学习在电商、金融科技、物流等场景的应用有着深刻的理解和布局。

二、 顶尖机构和大学

国内高校和研究机构在联邦学习的理论研究、算法创新和人才培养方面做出了卓越贡献。

高校:
清华大学: 在计算机科学、人工智能、密码学等多个领域都处于国内领先地位。其人工智能研究院、网络研究院等是联邦学习研究的重要基地。
北京大学: 在计算机科学、信息科学等领域拥有深厚的学术积淀,其信息科学技术学院、人工智能研究院在隐私计算、分布式系统等方向有前沿研究。
中国科学技术大学: 在计算机科学、信息科学领域实力雄厚,特别是在机器学习、大数据和隐私保护计算方面有较强的研究团队。
浙江大学: 在计算机科学、软件工程、人工智能等领域实力强劲,其计算机科学与技术学院、人工智能研究所是联邦学习研究的重要力量。
上海交通大学: 在计算机科学、信息安全、人工智能等领域有着突出优势,其计算机科学与工程学院、网络空间安全学院在隐私计算、分布式系统方面有深入研究。
南京大学: 其计算机科学与技术系在人工智能、机器学习、数据库等领域有很强的实力,在联邦学习的算法和应用方面有活跃的研究。
西安交通大学: 在计算机科学、信息安全、人工智能等领域有较强的研究实力,特别是在隐私保护计算和分布式系统方面有积极探索。
哈尔滨工业大学: 在计算机科学、软件工程、人工智能等领域是国内的传统强校,其相关学院在联邦学习的理论和工程实现方面有深入研究。
北京航空航天大学: 在计算机科学、人工智能、信息安全等领域有深厚的底蕴,其相关学院在联邦学习的算法优化、安全性和应用方面有积极的探索。

研究机构:
中国科学院: 属下多个研究所,如计算技术研究所、软件研究所、信息工程研究所等,在人工智能、分布式系统、信息安全等领域都有顶尖的研究团队,为联邦学习的基础理论和关键技术提供了重要支撑。
中国信息通信研究院(CAICT): 作为国家级的通信和信息技术研究机构,CAICT在推动新技术标准制定、产业化落地方面扮演着重要角色。其在隐私计算、区块链等方面的研究,与联邦学习的生态建设紧密相关。
中国人民银行金融科技研究院: 鉴于联邦学习在金融领域的巨大应用潜力,金融机构的科技研究院也是重要的研究力量,他们不仅关注技术本身,更注重与金融业务的结合以及合规性问题。

联邦学习国内发展亮点与趋势:

1. 金融科技领域先行: 微众银行的实践是典型的例子,银行、券商、保险等金融机构在反欺诈、风险控制、精准营销等场景率先引入联邦学习,因为这些场景对数据隐私有极高的要求。
2. 医疗健康领域崛起: 医疗数据是典型的隐私敏感数据,联邦学习为实现跨机构的医疗数据协同分析提供了可能,例如药物研发、疾病预测等。一些高校和医疗机构在这一领域进行了积极探索。
3. 多方安全计算(SMC)与同态加密(HE)的融合: 联邦学习的安全保障离不开密码学技术的支持。国内专家在SMC和HE等技术的研究深度和广度都在不断提升,并将其与联邦学习算法相结合,以提供更强的隐私保护能力。
4. 隐私保护和模型效率的权衡: 联邦学习在提供隐私保护的同时,也面临着模型聚合效率、计算资源的消耗、模型收敛速度等挑战。国内研究团队在设计更高效、更鲁棒的联邦学习算法方面做了大量工作,例如差分隐私的优化、局部模型聚合策略的改进等。
5. 联邦学习框架和平台的搭建: 除了学术研究,将联邦学习技术转化为可用的工程化框架和平台,是实现大规模应用的关键。国内一些科技公司和研究机构正在积极构建开源或商业化的联邦学习平台,以降低应用门槛。
6. 合规与监管的重视: 随着数据安全和个人信息保护法律法规的日益完善,联邦学习在合规性方面的研究也越来越受到重视。如何确保联邦学习的过程符合相关法律要求,是未来发展的重要方向。

总而言之,联邦学习在国内是一个充满活力和潜力的领域,不仅仅是微众银行,而是汇聚了众多顶尖的学术机构、研究人员和企业力量,共同推动着这项技术的进步和应用落地。您可以关注这些高校和机构在顶级学术会议(如NeurIPS, ICML, KDD, CCS, S&P等)和国内重要会议(如CCF会议)上的相关论文和报告,来更深入地了解最新的研究进展。

网友意见

user avatar

国内篇:

Qiang Yang, Tianjian Chen, Yang Liu, Yongxin Tong.

微众银行开源 FATE 框架.

Federated machine learning: Concept and applications

Secureboost: A lossless federated learning framework


Jiankai Sun, Weihao Gao, Hongyi Zhang, Junyuan Xie.

字节跳动开源 FedLearner 框架.

Label Leakage and Protection in Two-party Split learning


Yi Li, Wei Xu.

华控清交 PrivPy 多方计算平台

PrivPy: General and Scalable Privacy-Preserving Data Mining


Hongyu Li, Dan Meng, Hong Wang, Xiaolin Li.

同盾科技 同盾志邦知识联邦平台

Knowledge Federation: A Unified and Hierarchical Privacy-Preserving AI Framework

FedMONN: Meta Operation Neural Network for Secure Federated Aggregation


Tongxin Li, Yu Ding, Yulong Zhang, Tao Wei.

百度 MesaTEE 安全计算平台

gbdt-rs: Fast and Trustworthy Gradient Boosting Decision Tree


矩阵元 Rosetta 隐私开源框架

百度 PaddleFL 开源联邦学习框架

蚂蚁区块链科技 蚂蚁链摩斯安全计算平台

阿里云 DataTrust 隐私增强计算平台

百度 百度点石联邦学习平台

京东京东数科 FedLearn 平台

富数科技 FMPC 安全计算

......


香港科技大学

FedVision: An Online Visual Object Detection Platform Powered by Federated Learning

BatchCrypt: Efficient Homomorphic Encryption for Cross-Silo Federated Learning

Abnormal Client Behavior Detection in Federated Learning


北京航空航天大学

Federated machine learning: Concept and applications

Failure Prediction in Production Line Based on Federated Learning: An Empirical Study


国际篇:

H. Brendan McMahan. Daniel Ramage. Jakub Konečný. Kallista A. Bonawitz. Hubert Eichner.

Google 提出 Federated Learning.

Communication-efficient learning of deep networks from decentralized data

Federated Learning: Strategies for Improving Communication Efficiency

Advances and Open Problems in Federated Learning

Towards Federated Learning at Scale: System Design

Differentially Private Learning with Adaptive Clipping

......(更多联邦学习相关文章请自行搜索 Google Scholar)


Cornell University.

Antonio Marcedone.

Practical Secure Aggregation for Federated Learning on User-Held Data

Practical Secure Aggregation for Privacy-Preserving Machine Learning.

Eugene Bagdasaryan, Andreas Veit, Yiqing Hua, Deborah Estrin, Vitaly Shmatikov.

《How To Backdoor Federated Learning》

Differential privacy has disparate impact on model accuracy

Ziteng Sun.

Can you really backdoor federated learning?

user avatar

有很多,但除了微众、阿里以外,别的机构都是拿开源的框架应用起来,谈不上研发。商业市场上这无可厚非,如果题主是被导师捉去做联邦学习选题的话建议看微众的FATE,下面简要讲几个联邦学习技术的入场玩家。

平安科技

平安科技在联邦学习这块,业务上的应用很全面。讲讲“蜂巢”,由平安科技“开发”的一个联邦学习平台。除了常规的功能之外,蜂巢平台能够支持更多的深度学习框架。蜂巢宣称可实现的有:提供基于联邦学习的医疗影像数据平台、扩接融合用户特征与个性推荐系统和动态车险定价模型系统等。

主要特性,支持多种深度学习框架,如TensorFlow,Keras,Pytorch,MXNet等。

谷歌

谷歌虽然不是国内的,不过作为首个提出联邦学习概念人,不得不提一嘴。TensorFlow
Federated (TFF) 是一个开源框架,用于对分散式数据进行机器学习和其他计算。我们开发 TFF 是为了促进联合学习 (FL) 的开放研究和实验,FL 是一种机器学习方法,使我们能够跨多个参与客户端训练共享全局模型,并将训练数据保存在本地。例如,FL 已被用于训练手机键盘的预测模型,但不会将敏感的输入数据上传到服务器。

开发者可以利用借助 TFF 对其模型和数据模拟所包含的联合学习算法,以及实验新算法。TFF 提供的构建块也可用于实现非学习计算,例如对分散式数据进行聚合分析。

借助 TFF,开发者能够以声明方式表达联合计算,从而将它们部署到不同的运行时环境中。TFF 包含一个用于实验的单机模拟运行时。

百度安全

MesaTEE泛在安全计算平台让隐私保护的大数据分析以及机器学习成为可能,实现“计算皆可上云”,打破数据孤岛,让大数据在保护隐私的前提下发挥最大价值。除了兼容当前主流的大数据和AI框架,MesaTEE能支持Intel SGX/AMD SEV/ARM TrustZone/Risc-V等诸多平台,也能提供无硬件支持的高对抗可靠执行环境,可应用于广泛的场景。

主要特性,可信执行、安全性远程验证、强化内存安全、安全节点不可绕过、FaaS服务、端到端加密。

最后来讲下目前我比较感兴趣的两家:

微众银行

如题主所说,微众确实在国内把联邦学习经营的不错。上文提到的FATE,就是是他们开源的一个联邦学习框架,这个安全的计算框架是其打算用来构建联邦学习(人工智能)生态用的。目前来看,它支持实现多个计算协议的兼容,以及类似欧洲GDPR之类的隐私方案要求下的合规化。采用的可拓展模块化工程思维,使得建模可以“流水线式”,提供可视化、调度系统等拓展包,较易上手,性能也非常出色。

主要特性,支持多方安全计算模式下的逻辑回归、BoostingTree,深度学习等多种机器学习算法,同时提供加密方式,支持同态加密、秘密共享和哈希散列等多方安全计算机制。

FATE目前的落地应用方案较多,车险、智慧城市、金融风控、智慧零售等都有运作中的方案,也听闻有些高校导师直接点名做这个研究方向。

github链接:github.com/FederatedAI/

阿里(蚂蚁金服)

蚂蚁金服其实不算是“联邦学习”,而是称为“共享机器学习”,但因为逻辑以及目标是一致的,所以放进来也讲讲。共享机器学习(Shared Machine Learning)的定义:在多方参与且各数据提供方与平台方互不信任的场景下,能够聚合多方信息并保护参与方数据隐私的学习范式。

主要特性,对比其他的方案兼容更多的安全计算技术,与联邦学习最大的差异在于数据是流出本地的,通过兼容更多的加密技术来保证其安全性。

共享机器学习弊端额多,例如在实践层面,传输数据的通讯是一笔挺大的开销,尤其是加密数据的通讯吃的带宽成本很可观。而TEE技术(Trusted Execution Enviroment 可信执行环境)受限制的也很多,例如能够支撑的算力合存储空间都非常受限,很难适应深度学习的需求、不支持GPU等问题,更要命的是目前云端可用的TEE只有Intel一家供应商,某为的事件之后,这样的“垄断”就很值得警惕了。

而理论层面,逻辑上只要是数据有离开本地的行为,是存在泄密风险的,毕竟没有无法破解的加密。例如你能保证自身的环境安全,你保证的了可信执行的第三方安全吗?

以上,是几家大厂对联邦学习的布局,认识的有些导师是有点名要求研究方向选联邦学习,但未在官方渠道公布,所以这些科研机构就不写进来了。

类似的话题

本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou

© 2025 tinynews.org All Rights Reserved. 百科问答小站 版权所有