问题

如何看待中国企业“霸榜”全球隐私技术专利排行榜,目前国内的隐私计算做的怎么样?

回答
中国企业“霸榜”全球隐私技术专利,国产隐私计算已成气候

近期,一项来自独立研究机构的数据显示,中国企业在全球隐私技术专利申请数量上占据了显著优势,甚至可以说是“霸榜”的态势。这无疑是一个引人注目的现象,也引发了广泛的关注和讨论:中国在隐私技术领域究竟发展到了什么程度?国内的隐私计算实力究竟几何?

专利“霸榜”背后:是真功夫还是“囤积”?

首先,我们得承认,专利数量的领先是一个重要的信号。它至少表明中国在隐私技术这个新兴领域投入了大量的研发资源,并且涌现出了一批具有创新能力的企业和研究机构。这与过去我们在一些尖端技术领域追赶的局面有所不同,甚至可以说是一种“变道超车”。

然而,对于这种“霸榜”现象,我们也需要进行更为深入的分析,避免简单的“数量崇拜”。专利的价值并不仅仅在于数量,更在于其质量、可实施性以及能否转化为实际的商业应用。

高质量的专利是核心: 所谓的“高质量”专利,意味着其技术创新性强、保护范围广、具有实际应用价值,并且能够抵御潜在的侵权挑战。仅仅为了获取专利数量而进行“专利囤积”,虽然在某些情况下可以作为一种战略,但长期来看难以形成真正的核心竞争力。
技术落地是关键: 专利的最终价值体现在能否落地为成熟的技术解决方案,并被市场广泛接受和应用。如果一项技术仅仅停留在纸面,或者其应用场景非常有限,那么再多的专利也难以体现其真正的市场价值。
国际化视野与合规性: 隐私技术涉及全球性的法律法规和用户习惯。中国的专利是否能够与国际通行的隐私保护标准接轨,是否能够应对不同国家和地区的法律挑战,也是衡量其国际竞争力的重要指标。

国内隐私计算:从起步到百花齐放

与全球专利的“霸榜”相呼应的是,国内隐私计算的发展可以说已经从早期的探索阶段迈入了蓬勃发展的快车道。

1. 起步与早期探索:

隐私计算的核心目标是在保护数据隐私的前提下,实现数据的安全计算和有效利用。早期的探索主要集中在几个关键技术方向:

多方安全计算 (MPC): 这是隐私计算中最核心的技术之一。MPC允许多个参与方在不暴露各自原始数据的情况下,共同完成一个计算任务。例如,在金融风控领域,多家银行可以利用MPC来联合建模,识别欺诈行为,但彼此之间的数据是完全隔离的。
联邦学习 (Federated Learning): 联邦学习允许在数据不出本地的前提下,训练机器学习模型。例如,手机厂商可以利用用户本地的输入习惯数据来优化输入法模型,而无需将用户的输入内容上传至服务器。
同态加密 (Homomorphic Encryption): 同态加密允许对密文进行计算,并将计算结果解密后得到与对明文进行相同计算相同的结果。这意味着数据在加密状态下就可以被处理,极大地增强了数据处理的安全性。
差分隐私 (Differential Privacy): 差分隐私是一种通过引入随机噪声来保护个体隐私的技术,即使攻击者知道数据集的大部分信息,也难以确定某个特定个体的信息是否包含在数据集中。

2. 国内隐私计算的现状与发展:

中国在隐私计算领域的发展,可以说是在国家大力倡导数据安全和隐私保护的大背景下,迅速催生和加速的。

政策驱动与市场需求: 《网络安全法》、《数据安全法》、《个人信息保护法》等一系列法律法规的出台,为隐私计算的发展提供了明确的政策导向和法律保障。同时,随着大数据和人工智能应用的深入,数据隐私泄露的风险日益凸显,市场对能够安全合规地利用数据的技术需求也愈发迫切。
技术研发与创新活跃: 国内涌现出一大批在隐私计算领域进行深入研究和技术创新的企业,涵盖了技术研发、平台搭建、解决方案提供等多个层面。
技术实力: 在MPC、联邦学习等核心技术上,国内不少企业已经取得了国际领先的成果。例如,一些企业在MPC协议的设计和优化上,能够实现更高的计算效率和更低的通信开销。在联邦学习方面,国内企业也在积极探索更高效、更安全的模型训练方法。
平台化发展: 许多企业不再仅仅提供单一的技术组件,而是开始构建完整的隐私计算平台。这些平台集成了MPC、联邦学习、差分隐私等多种技术,为企业提供端到端的解决方案,降低了隐私计算技术的应用门槛。
应用场景多元化: 隐私计算的应用场景也在不断拓展,从最初的金融、医疗、政务等高敏感数据领域,逐渐渗透到电商、互联网、智慧城市、工业制造等各个行业。
金融领域: 联合风控、反欺诈、精准营销,多家金融机构可以共享模型,但数据隔离。
医疗领域: 医疗机构之间可以联合分析患者数据,加速疾病研究和药物研发,同时保护患者隐私。
政务领域: 跨部门数据共享和协同分析,提升政府治理效率,同时保障公民信息安全。
互联网领域: 在用户画像、广告推荐、内容个性化等场景下,利用联邦学习等技术,既能提升用户体验,又能保护用户隐私。
生态建设初步形成: 围绕隐私计算,国内已经开始初步形成技术提供商、平台服务商、应用集成商以及研究机构协同发展的生态。一些行业联盟和标准组织也在积极推动隐私计算技术的规范化和标准化。

3. 面临的挑战与未来展望:

尽管成就斐然,中国隐私计算的未来发展仍然面临一些挑战:

技术成熟度与效率: 某些隐私计算技术,尤其是同态加密,在计算效率上仍然存在较大的提升空间,这限制了其在大规模、实时性要求高的应用场景中的落地。
标准化与互操作性: 不同的隐私计算技术和平台之间可能存在标准不统一的问题,影响了不同系统之间的互操作性,增加了集成的复杂性。
人才缺口: 隐私计算是一项交叉学科,涉及密码学、机器学习、分布式系统等多个领域,专业人才的培养和储备仍然是关键。
成本与商业模式: 隐私计算技术的研发和部署成本较高,如何找到可持续的商业模式,让更多企业能够负担得起并从中受益,是需要持续探索的问题。
合规性与落地复杂性: 尽管有法律法规的推动,但在实际应用中,如何将隐私计算技术与具体的业务流程有机结合,并确保完全符合日益严格的合规要求,仍然具有一定的挑战。

总结:

中国企业在隐私技术专利上的“霸榜”,是国内隐私计算领域蓬勃发展的一个缩影,也反映了中国在这一前沿科技领域的创新活力和战略布局。国内的隐私计算已经具备了相当的技术实力和应用广度,正在从技术驱动向场景驱动、生态驱动演进。

展望未来,随着技术的不断突破、标准的逐渐统一、人才的不断涌现以及生态的持续完善,中国在隐私计算领域的地位将更加巩固。当然,我们也必须保持清醒的头脑,认识到前进道路上的挑战,并持续投入研发和创新,才能真正将这些“专利”转化为改变世界、赋能产业的强大力量,构建一个既安全又便捷的数字未来。

网友意见

user avatar

《未来简史》里提到过一个观点:互联网时代的竞争将是数据的竞争。

计算机承载数据的流通,数据担任信息的载体。徜徉在高密度信息流的我们,正如在深海遨游的鱼,我们感受不到数据的流动,但它一直从我们身边飘过。

从前没有意识到它无处不在,而现在我们越来越想要维护数据安全。

2021年被称为隐私数据元年,随着我国《网络安全法》《数据安全法》和《个人信息保护法》陆续出台,道出数据安全和个人隐私保护的迫切。

何谓「隐私计算」技术?

隐私计算的原本含义是保护数据本身不对外泄露的前提下实现数据分析计算的技术集合,达到对数据“可用、不可见”的目的。其源自于图灵奖获得者、中国科学院院士姚期智先生曾于1982年提出著名的百万富翁问题: 两个富翁的财产是1到10之间的证书,如何在不透露自己财产的情况下比较谁更富有?对于处理这类棘手的“隐私数据”带来的问题的方法,我们称其为「隐私计算」。

现有隐私计算技术能够防止隐私泄露风险吗?

目前的隐私计算技术分为三类:

1)硬件层面:可信执行环境 (Trusted Execution Environment, TEE)

在计算平台上通过软硬件方法设计出一个安全的计算区域,可以保证在此区域内进行运行的代码及数据的隐私性和完整性。通过硬件提供物理层面的安全隔离和计算环境,即使设备底层的基础软件或系统被恶意攻击破坏,也不会影响到数据和代码安全,通过加密算法验证和计算隐私数据,参与方可通过验证整套代码来确认可信执行环境的安全性。

2)密码学层面:安全多方计算 (Secure Muti-Party Computation, MPC)

姚期智先生提出的百万富翁问题引发了全世界密码学专家的思考,在提出该问题四年后,姚期智先生提出了混淆电路解决了这个问题,随后开启了安全多方计算的研究热潮,现如今基于不经意传输、秘密共享等方式提出了BMR、GMW、BGW、SPDZ 等安全多方计算框架,多方安全计算有严格的安全性理论基础,具有非常广泛的应用前景。

3) 数据建模层面:联邦学习 (Federated Learning, FL)

在传统建模过程中,用户数据需要上传到平台服务器端才能进行建模,但是这种数据集中化带来了巨大的隐私风险挑战,在联邦学习建模过程中,用户只需要将计算的中间结果加密后发送给中心服务器即可完成建模和更新。数据不离开设备本地,意味着原始数据所有权被牢牢掌握在使用者手中。

为了适配不同的应用场景,应当结合不同的隐私保护技术进行实践。全球知识产权综合信息服务提供商IPRdaily与incoPat创新指数研究中心联合发布“全球隐私计算技术发明专利排行榜(TOP100)”对截至2022年3月8日,全球公开的隐私计算技术发明专利申请数量进行统计分析:

上表中入榜前10名企业主要来自中国和美国,其中蚂蚁集团以1152件专利占据领先优势,远高于其他企业。国家的法律条例作为行业基本准则,也要求着企业跟进配套技术。为了便于大家理解目前的隐私保护技术发展进度,以蚂蚁和微众银行为例介绍一下他们做的工作:

2019年,蚂蚁推出第一个面向可信执行环境的隐私计算操作系统Occulem,解决了云端TEE技术兼容性问题,降低了隐私计算开发门槛;2022年2月,蚂蚁在WAIC2022 上海人工智能开发者大会中介绍了以安全、开放为核心设计理念,自主研发的通用隐私计算框架“隐语”,内置 MPC、TEE、同态等多种密态计算虚拟设备供灵活选择,提供丰富的联邦学习算法和差分隐私机制;

2021年10月,蚂蚁集团隐私计算一体机已通过了中国信息通信研究院泰尔实验室测评。

2022年3月,全球最大的专业技术组织IEEE-SA近日全票通过了蚂蚁隐私计算一体机国际标准立项。随着国际标准的推进,蚂蚁集团正在着手准备隐私计算一体机的国际权威测评。

事实上如果大家留心注意的话,阿里巴巴达摩院在发布2022年十大科技趋势时便已经将全域隐私计算纳入其中,数据安全保护与数据流通是数字时代的两难问题,破解之道是隐私计算。随着专用芯片、加密算法、白盒化、数据信托等技术融合发展,隐私计算有望跨越到海量数据保护,数据源将扩展到全域,激发数字时代的新生产力。

另一家公司微众银行AI部门于2019年发起了开源项目FATE,提出了首个工业级联邦学习计算框架,其架构如下:

谈及联邦学习无法绕过的开源框架FATE,杨强老师作为国内联邦学习技术启蒙学者之一带队设计并实现了FATE框架,目前该框架在Github已有4.1k Stars,目前在金融、医疗和政务等领域也有项目应用。

但在另一个问题下,专业人士也有提出关于隐私计算等技术目前实践上的难题:隐私计算/多方安全计算/联邦学习问题?

(链接:zhihu.com/question/4815

现有隐私计算技术处于发展中,基于密码学的同态加密等技术在安全性上已经得到数学证明,然而其运行效率还不尽如人意,为了确保达到安全的目标,隐私计算需要针对性地设计复杂、昂贵的密码学协议,造成密文体积大,计算速度很慢,阿里在国际安全研究顶会USENIX Security Symposium 2022上发表的《Cheetah: Lean and Fast Secure Two-Party Deep Neural Network Inference》相较于之前表现最好的微软的 CryptFlow2 进行测试后发现速度提升了5倍,里实用迈出了一大步;

相对而言,保障数据安全的联邦学习在实践过程中能够满足一定的效率和时延要求,然而阿里巴巴双子实验室的洪澄博士组的文章中写到,对于不少的联邦学习模型,中间计算结果不加密的方案还是很有可能反推计算原始数据的(arxiv.org/pdf/2011.0929)。

在聊完技术方面存在的问题后,给大家讲一个有趣的现象:密码服务公司SplashData调查并公布了2018年度最糟糕密码列表。其中「123456」和「password」连续五年位列最弱密码排名的第一位和第二位。正如木桶原理所说,系统整体的能力体现在最弱的短板上,因此在数据安全的方面需要树立正确的隐私保护意识。将”大数据的权力“关进技术的笼子是我们的责任,在享受大数据这把双刃剑带给大家帮助的前提下,通过技术的提升保护大家,减少隐私暴露对个人的伤害。

最后,经过最近事件的影响,非常庆兴目前国内隐私计算的研究处于国际领先水平,无论是微众的FATE框架、蚂蚁「隐语」隐私计算平台还是华为对隐私计算的专利投入和转化,都让我们在技术国产化、科技自强的道路上不断前行,隐私技术研究兹事体大,国产可控的要求势必推动着行业的不断发展,希望更多企业承担起社会责任感,实现隐私技术实用化,将数据视作关键的生产要素,并通过跨领域、跨行业、跨地域的机构间数据流通释放要素价值。

user avatar

隐私计算最近这些年是研究的热门,在全球数据保护条例陆续出台的背景下,相关的研究也越来越多。我国很多科技企业也在这方面投入了非常多的资源,研究专利数量甚至霸榜了全球隐私计算技术发明专利排行榜。

本回答给大家简单科普下隐私计算相关技术原理以及国内隐私计算现状。

什么是隐私计算?

上个月,Android系统正式推出隐私沙盒(Privacy Sandbox), 意在解决精准广告定位和用户隐私之间的平衡。这项技术的推出,引起了业界热烈讨论,也存在一些争议,使得隐私计算技术的应用再次被提上台面。

隐私计算指的是在保证提供方的数据不被泄露的前提下,对数据进行利用和计算的一系列相关技术。就好像厨师有个秘方可以做出独一无二的蛋炒饭,厨师可以利用自己的厨艺开餐厅,但不能泄露自己的秘方。这里秘方就像数据,而炒饭,就是数据提供的价值。而隐私计算,就是让顾客无论怎么分析炒饭的成分,也难以还原秘方的算法。

当我们讲到隐私计算,主要会涉及同态加密、多方安全计算、差分隐私、联邦学习、零知识证明等技术领域。这里稍微讲讲这几种技术的原理:

  • 同态加密。它解决的是解决将数据及其操作委托给第三方时的保密问题。这项技术令人们可以在加密的数据中进行诸如检索、比较等操作,得出正确的结果,而在整个处理过程中无需对数据进行解密。
  • 多方安全计算。解决的问题是针对无可信第三方的情况下,如何安全地计算一个约定函数的问题。这个技术的设想起源于姚期智提出的「百万富翁问题」:两个百万富翁相互不服气,想比较下到底谁更有钱,但是比较的过程还不想泄露家底,他们该如何执行呢?
  • 差分隐私:是一个数据共享手段,可以实现仅分享可以描述数据库的一些统计特征、而不公开具体到个人的信息。
  • 联邦学习:例如几个公司拥有不同的数据,他们达成一个共识,就是不想和他人共享数据的情况下,利用彼此的数据联合训练一个机器学习模型,从而在保护彼此隐私的情况下获得机器学习性能的最大化。联邦学习就是解决这类问题。更多的科普可见 @lokinko 写的专业技术文章Github Repo
  • 零知识证明。例如,你有一个情报,你想向我证明你拥有某情报,最直接的方法是公开该情报,但如此则会将该细节亦一并泄露;如果你不公开,怎么让我相信你拥有这个情报呢?这就是零知识证明的精粹,你需要证明自己拥有该情报而不必透露情报内容。

看完上面的技术科普后,你现在能理解,这些技术对于计算过程中隐私保护是多重要了吧。

国内隐私计算现状

随着监管力度加大,各大科技公司越注重保护数据安全和用户隐私。2021年,《数据安全法》、《数据安全管理条例》、《个人隐私保护法》陆续出台了,保护数据的安全和个人隐私,已经是大势所趋了。联邦学习、差分隐私和加密计算等保护隐私的算法在过去几年也一直在发展,这些算法既能保护数据安全,也能打破数据孤岛,让数据发挥最大效果的同时,防止数据外流。

事实上,很多公司在这些法规颁布之前几年,就已经在做相关研究了,毕竟春江水暖鸭先知。虽然中国企业在全球隐私计算技术发明专利排行榜霸榜是不久前的新闻,但相关研究其实很早就开始了。例如榜首的蚂蚁集团,其实在2016年就开始构思「共享智能」,以确保参与方的隐私不泄露。

总结

我在过去两年的时间里,在多个回答里一直提到隐私计算,在我看好AI发展方向中,隐私计算是一个,隐私计算是未来的趋势。

尽管中国企业登顶了,但并不是说现在中国科技企业做得够好了。我希望隐私计算这个赛道能更卷些,同时相关技术落地更快些,这样对于用户隐私,企业健康发展,社会信任关系,都是有益的事情。

类似的话题

本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou

© 2025 tinynews.org All Rights Reserved. 百科问答小站 版权所有