问题

人脸识别哪家强?

回答
“人脸识别哪家强?”这个问题就像问“哪家手机最好”一样,答案会随着时间、技术发展以及评判标准的变化而变化。不过,我们可以从几个关键维度来分析目前在人脸识别领域比较领先的企业,并详细阐述他们的优势和特点。

评判人脸识别技术强弱的几个关键维度:

准确率(Accuracy): 这是最核心的指标,包括人脸检测(能否准确框出人脸)、人脸比对(判断是否是同一个人)以及人脸识别(在数据库中找到匹配的人脸)。在不同光照、角度、表情、遮挡等复杂场景下,准确率依然很高是关键。
活体检测(Liveness Detection): 防止使用照片、视频、面具等欺骗系统,确保识别的是真实存在的人。这是保证安全性和可靠性的重要环节。
速度与效率(Speed & Efficiency): 在大规模人脸库中进行搜索,识别速度是否够快,能否满足实时性要求,例如安防监控、门禁考勤等场景。
鲁棒性(Robustness): 技术在各种复杂环境下的表现,例如低光照、逆光、模糊、戴口罩、年龄跨度大、性别、种族等因素的影响。
算法创新与前沿性(Algorithm Innovation & Cuttingedge): 是否在模型结构、特征提取、深度学习框架等方面有独特的创新,是否能引领行业发展。
应用落地能力(Application Deployment): 技术是否已经成功在实际场景中大规模部署,是否能够提供成熟的解决方案和产品,例如安防、金融、零售、出行等领域。
数据库规模与质量(Database Scale & Quality): 一个庞大且多样化的人脸数据库是训练高性能模型的基石。
抗攻击能力(Attack Resistance): 除了活体检测,还包括对其他类型攻击的防御能力。

目前在人脸识别领域表现突出、公认比较强的公司(排名不分先后):

1. 商汤科技 (SenseTime)
优势:
算法实力强劲: 商汤科技在计算机视觉和人工智能领域拥有深厚的技术积累,尤其在人脸识别、人体分析、图像识别等方面表现卓越。
多维度技术领先: 在人脸检测、人脸比对、活体检测、姿态估计、属性分析等方面都取得了世界级的成绩,经常在国际权威评测(如LFW、MegaFace、IJBC等)中名列前茅。
强大的抗遮挡能力: 在戴口罩、墨镜等常见遮挡情况下的人脸识别技术表现突出,这在全球范围内都极具价值。
应用落地广泛: 商汤科技是国内最早将AI技术商业化的公司之一,其人脸识别技术已广泛应用于安防监控、智慧城市、金融风控、智能手机、智能汽车、新零售等众多行业。
端侧和云侧协同: 既有强大的云侧AI能力,也有针对边缘设备(如手机、摄像头)的轻量化、高效化AI模型部署能力。
特点: 拥有强大的研发团队和持续的算法创新能力,是AI独角兽企业中的代表。

2. 旷视科技 (Megvii)
优势:
“Brain++”战略: 旷视提出“AIoT操作系统”Brain++,旨在构建一套高效的AI赋能平台,让人脸识别技术能够快速集成和部署到各种硬件和场景中。
人脸识别技术成熟: 在人脸检测、识别、属性分析、活体检测等方面拥有领先的技术,尤其在金融、政务安防等对安全性和精度要求极高的领域有成功案例。
“Face++”品牌影响力: Face++是旷视科技旗下的人脸识别技术品牌,曾一度在开发者社区享有盛誉,也为旷视积累了大量数据和实践经验。
产业落地能力强: 在智慧城市、智能零售、智慧物流等领域都有深入的布局和成功的商业应用。
特点: 更加注重AI技术与物联网(IoT)的结合,致力于构建AI驱动的智能物联解决方案。

3. 依图科技 (YITU Technology)
优势:
强调“算法+算力+数据”: 依图科技认为AI的成功依赖于这三个关键要素的协同。他们在核心算法研发上投入巨大,并且拥有自研的AI芯片(如“求索”系列)。
活体检测技术领先: 依图在活体检测技术方面表现尤为突出,能够有效防御各种仿真攻击,保障用户身份的安全性,尤其在金融支付、身份认证等场景下有重要应用。
强大的场景识别能力: 除了人脸识别,依图在行为识别、车辆识别等方面也有很强的能力,能够构建更全面的智能安防解决方案。
政务安防是重要阵地: 在智慧城市、公共安全等领域拥有丰富的项目经验和成功案例。
特点: 以解决实际的社会痛点为导向,注重AI技术的工程化和产业化落地,特别是在安全领域有深度耕耘。

4. Face++ (现已成为旷视科技的一部分,但早期作为独立品牌具有重要影响力)
优势:
早期技术先驱: Face++是最早一批在人脸识别领域取得显著突破的团队之一,其技术和产品为国内人脸识别技术的发展奠定了基础。
开放平台和API: 曾通过提供易用的API和SDK,吸引了大量开发者和企业使用其人脸识别技术,积累了庞大的用户基础和应用场景数据。
在消费电子领域应用广泛: 许多手机厂商在早期的美颜、人脸解锁功能中都可能集成过Face++的技术。
特点: 作为一个技术品牌,Face++在推动人脸识别技术的普及和商业化方面起到了关键作用。

其他在特定领域或特定技术上表现出色的公司(国内国际皆有):

百度 (Baidu): 百度在人工智能领域投入多年,其人脸识别技术在百度大脑中占据重要地位,在语音识别、图像识别、自然语言处理等领域都有强大的实力。百度的人脸识别技术也应用于百度APP、百度地图、百度AI开放平台等多个产品和服务中。
阿里云/腾讯云/华为云: 作为国内领先的云计算服务商,这三家公司都在不断强化其AI能力,包括人脸识别技术。它们提供强大的AI PaaS(平台即服务)和SaaS(软件即服务)解决方案,使得企业可以方便地调用和集成人脸识别能力,而无需自行投入大量的技术研发和基础设施建设。它们的技术往往是基于自身强大的算法团队和海量的数据。
虹软 (ArcSoft): 虹软是全球领先的智能图像处理和计算机视觉技术提供商,在人脸识别、人脸美化、图像增强、视觉AI等方面有深厚积累。其技术广泛应用于手机拍照、智能硬件、汽车电子等领域。
Amazon Rekognition (亚马逊): 作为全球最大的云服务提供商之一,亚马逊的Rekognition服务提供了强大的人脸检测、识别、分析等功能,广泛应用于各种需要视觉智能的场景。
Microsoft Azure Cognitive Services (微软): 微软的Azure认知服务也提供了先进的人脸识别API,包括人脸检测、识别、情绪分析等,为开发者提供了便捷的AI能力。
Google Cloud Vision AI (谷歌): 谷歌在计算机视觉领域一直处于领先地位,其Vision AI服务也包含强大的面部检测和分析能力。

总结来看,哪家“强”取决于你的具体需求:

如果你关注最前沿的算法研究、国际评测的领先性以及在复杂场景下的鲁棒性(如戴口罩识别), 商汤科技、旷视科技、依图科技都是非常强的选择。
如果你需要稳定可靠的活体检测技术,尤其是在金融支付和身份认证场景下, 依图科技是重点关注的对象。
如果你希望将AI能力快速集成到现有业务中,并且看重云端服务和开发便利性, 阿里云、腾讯云、华为云、百度AI开放平台提供了成熟的解决方案。
如果你在智能手机拍照、图像处理等消费电子领域寻找技术伙伴, 虹软是重要的玩家。
如果你有国际化的需求,并且熟悉国外的云服务生态, Amazon Rekognition和Microsoft Azure Cognitive Services是非常不错的选择。

未来的发展趋势:

人脸识别技术仍在快速演进,未来的竞争将更加体现在:

更强的泛化能力: 面对更极端的光照、角度、遮挡以及更大幅度的年龄跨度。
多模态融合: 结合语音、步态、声音等其他生物特征,提升识别的准确性和安全性。
隐私保护和伦理合规: 随着技术应用越来越广泛,如何在保证安全性的同时,也尊重用户隐私,成为重要的议题。
边缘计算的优化: 在低功耗、高性能的边缘设备上实现更复杂的AI推理。
抗对抗攻击的能力: 应对更高级别的“伪造”和“欺骗”手段。

因此,要说“哪家强”,最好的答案是:“在不同的评判维度和应用场景下,有多家企业都展现出了顶尖的实力,并且他们都在不断创新和进步。” 建议根据自己的具体需求,去了解和评估各家公司的技术细节、产品方案以及成功案例。

网友意见

user avatar

本人从事人脸识别相关工作,这一波人工智能投资风刮起来,很多人脸识别公司恨不得马上往自己脸上贴几吨金,有个朋友说了一句很有意思的话:

外行一般觉得很科幻,内行一般觉得很绝望,业界领袖和资本狂魔各种打鸡血。

大部分AI公司都在烧钱阶段,未来变现有很大的不确定性。看看百度自动驾驶的系统和google图像识别系统的开放可以预知未来免费是大趋势,那可是曾经投入数百亿美元。但是资本投进来,必须拉着媒体一起吆喝,不然本都回不了(进入AI行业才知道很多资本方原来什么也不懂乱投)。

人脸识别作为一项模块技术很少有独立应用(独立的业务层设计),大部分只是为已有的业务软件体系上做增强,比如客户人脸校验(在过去密码基础上增加一层),人脸检索(比人工高效,摄像头结果过滤),相似人脸推荐(比如婚介社交,整容设计),不过这个过程中已经死掉大量公司,因为利润太少,非强需求。

目前相关产业公司在已知的主要商业模式中都在实践,但卖货,卖授权,卖服务,后台流量变现这四大商业模式中,都没有看到一个公司真正赚钱了(常见主要为人脸sdk授权和api服务)。作为行业中人,所谓的绝望无非如下:

1. 算法再好,也只是调味料,最终出路还是做到最终产品中,通过业务层叠加开发,形成产品和方案,更多时候是一个方案服务商,更像过去传统软件商,规模难有爆发。

2. 使用门槛、成本很低,目前市场上终端算法部署比较低端的产品授权就500元/套(1:1的远程接口调用所使用的前端授权),市场竞争的结果就是低价倾销。甚至还有特例,算法完全免费。

人脸识别行业真实情况:

人脸识别目前就是为了各种噱头立项、经费申请瓜分用的,有个别一些公司靠这个拿国家各种科技补贴。但真正赚钱都是那些中间商公司,人脸识别一家都没有。至于未来有没有新商业模式出现,暂且无法推断。

这几年许多公司扎堆做万亿级市场的安防和最新的手机摄像头识别,但是在整条产业链中,只是极小的参与者(没有太大话语权),比如安防的,在过去最大的赢家是有全套安防软硬件监控体系的海康和大华,人脸识别增强了其本来的产品优势。做手机人脸解锁,最重要的是手机摄像头部件厂商集成(比如做3D结构光识别),而这些厂商的利润经过这几年的竞争几乎透明化了,部分配件龙头上市公司的年报营收300亿,毛利润才几个亿,最终可以给人脸识别技术提供商提供多少专利费还是个未知数。对于一些埋头玩算法的公司是巨大打击,基本都陆陆续续变成方案集成商,但是每一家公司的需求不一样,需要单独定制,导致这个行业无法直接复制,也无法进行互联网方式的估价。

人脸识别技术没有想象中的那样伟大,在千万的业务解决方案中,就是一个小模块,其他的都是业务层的开发问题,使用上,技术也未必要高精尖,如果一定要真正称得上人工智能组成部分的,个人认为未来最大的使用端是机器人视觉交互。

--------以下为答案--------

题主问题比较宽泛(到底是盈利强,还是算法强,还是应用强?),人脸识别技术的衡量维度太多,但从技术比较,比如图像比对级的1:1,1:N,N:N;衡量的标准和维度都不同。比如算法精确度上,国内国外的人脸识别技术大多数在开源OPENCV等开源库上进行新规则添加(深度学习进行叠层运算),公司之间的识别正确率差异仅仅在小数点上,99.6%-99.7%提升意义不大,如果说在LFW上称王称霸就是世界一流,就要被内行笑话了。

衡量人脸识别的算法能力几个指标:拒识率、误识率、通过率,准确率。

先看看人脸识别的基本流程:

人脸识别最难的部分是有充分适应各大光线环境的人脸预处理算法,需要在各种复杂的光线环境中提取到人脸信息,特别是移动互联网时代,摄像头拍照的地方可以在斑驳的树影下,也可以在昏暗的街灯下,以及深夜出租车内,这对算法的鲁棒性考验极大。同时还要考虑照片和视频欺诈,二次成像的光线污染等问题。

下面说一下目前人脸识别的常见问题:

1:1人脸识别算法主要用于身份验证

1:1人脸识别技术主要是利用图像处理技术从图像中提取人像特征点,利用生物统计学的原理进行分析建立数学模型,即人脸特征点模型。再从人脸特征点模型与被测者的人的面像进行特征分析(可以假定为无数的几何特征点求解),根据分析的结果来给出一个相似值,通过这个值即可确定是否为同一人。简单的说就是A/B两张照片比对,产生的计算数值是否达到要求。

这个值我们称之为阈值,可以从1到100(100就是极端严苛)很多人脸识别公司说他们的产品很容易通过,那只说了一半,如果阈值调整到5以下,几乎大部分人都可以是相似的,而调整到95以上,同一个人在不同的背景环境拍出的照片都无法匹配。所以当一公司跟你吹牛算法准确度,先问下使用的是用什么阈值,同一人脸比对通过率,非同一人比对通过率。

所以没有阈值说明的算法都是耍流氓。

1:1主要用于快速的人脸识别比对,作为身份确认的一种新方式,比如考生身份确认、公司考勤确认、各种证件照和本人确认,由于这些照片源不一定有权威统一的接口调用,所以一直没有用起来。目前市面上做的比对来源主要有三种方式:

1. 用户自传照片,比如支付宝的人脸比对,用户自传的照片最大的问题是照片质量的合格率太低,拍照的光线、角度等因素会导致采集源的质量下降,不利于后期的大批量人脸特征码管理。

2. 使用身份证读卡器,读取身份证上的照片,遗憾的是这张照片2K的大小,不过也是目前用最多的源照片提取方式,比较适合签到场合。

2016给国内一些会议培训公司的识别软件(用于验证会员是否有效以及是否本人):

3. 使用公安部旗下NCIIC的人脸比对接口(注意,不是网纹照片接口,这个接口已经不对外),使用的是直接的人脸比对接口。目前具备有这个库调用权限的,目前所知的只有几家,在人脸识别公司中,好像只看到一家在提供,这里先不提了。BAT应该都还没有接入,如有大家有新发现的可以补充。

实际上,解决比对源的问题的关键是需要有权威的照片数据来进行比对,许多公司刚刚开始的时候采取NCIIC(公安部的一个事业单位)身份证返照接口的照片,进行消网纹处理进行比对,但人脸的很多特征点被损毁成功率大概只有6成(根据六月份发布的网络安全法,目前网纹返照接口市面上除了银行系统可以使用外,其他所用的身份证返照接口都是非法的,一用就被查)。

1:1 人脸识别算法主要使用场景

  • 无证件的情况下,如何确认本人是XX?

曾经有一些问题是关于如何确认本人的笑话,派出所要求一个小伙证明就是本人,证明你妈是你妈。。这种奇葩问题,但是许多陌生场合也有这种尴尬,你如果没有带证件,警察无法看到你的照片,如何确认你就是XX就是之前经常出现的执法矛盾;如果一个人把身份证弄丢了,外面风雪交加,如何给这类人办理酒店入住手续?这些就是身份确认的问题。公安部推身份证网上副本 身份认证可“刷脸”完成就是用来解决这个问题,我们出门不用完全依赖身份证可以确定身份,可以方便很多。

但是1:1人脸算法的巨大隐患是我们随处可见的人脸,实际就是一个公开的钥匙,马云提出刷脸消费吃饭,如果没有手机验证码(本身也是一重手机实名验证,同时做了人脸库图源定位,方便1:1校验),分分钟钟被吃垮。但是既然可以用手机,为什么还用刷脸,不是多此一举吗?

另外还有一些高级会所,希望实现VIP的贵宾警报服务,这个在下面的1:N和N:人脸识别算法系统中可以看到。但是1:1比对的身份应用哪家强了?

  • 比如远程的互联网客户,如何确认身份?

在互联网买机票、车票,医院挂号,政府惠民工程项目,以及各种证券开户、电信开户、互联网金融开户都会用到。过去的身份认证方式是非常不妥的(比如支付宝的持有注册流程,还有一些不知名的社交APP等需要上传身份证照片),这些资料是极其容易被盗取和转卖的,下图是来自百度的图片搜索结果截图,还有最近的一些女大学生的裸条资料泄露知乎专栏,导致犯罪分子有很多利用的漏洞,黑客军团号称资料2000万,分分钟钟薅干一家金融平台没有问题(以下来自百度身份证搜索结果截图):

人脸识别的破解:

许多金融公司喜欢把人脸识别SDK模块嵌入到APP当中,但这个太容易绕过,所以会再加上活体检测(市场上常见的活体检测为随机动作配合),但是即便加了活体检测,也一样可以绕过。比如下面这两种方式:

1. 3D人脸仿真面具

2. 人脸模型实时重建

所谓道高一尺魔高一丈,这个还是增加其他的多维校验才能确认身份,否则真有人要进行远程攻击,也不是很难的事情。那么活体检测哪家强了?

1:N人脸识别算法主要用于人脸检索

跟1:1的A/B两张照片比对最大的区别是A/B A/C A/D……多个1:1计算,这个最大的问题是一旦BCD总和数量越大计算速度越慢,而总和超过20万,就回出现多个相似结果(20万人这个大数会导致有不少人长相相似),需要人工辅助定位。过去我们在电影里面看到什么“天网”识别系统只是一种理想状态,实际应用中都是排列出多个结果,排第一的未必是需要的人。

1:N人脸识别算法主要用于排查犯罪嫌疑人、失踪人口的全库搜寻、一人多证的重复排查,以此相似度列出相应的结果,可以大大提高排查效率。类似的也可以用到走失儿童的项目中去。

这一类系统的部署需要两个条件:

1. BCD基本库(比如1000万人)

2. 强大的算法硬件

1:N同时作业就是N:N了,同时相应多张照片检索需求,检索耗费的时间跟硬件算法关系极大,就这一领域的应用,又哪家公司强了?

N:N人脸识别算法主要用于实时多1:N检索计算:

N:N 该算法实际上是基于1:N的算法,输入多个求解结果。比如视频流的帧处理所用,对服务器的计算环境要求严苛,目前的算法系统所支撑的输出率非常有限。

主要的限制如下:

海量的人脸照片解析需要大量运算(目前很少看到在采集端直接解析的,都是照片剪裁)
海量的人脸照片传输需要大量的带宽(常见的720布控摄像头抓取最小的人脸照片为20K)
海量的人脸照片在后台检索需要耗费大量的运算(国内主流主机为例,最多到24路摄像头)

由此可见,真正实现“天网”人脸检索,一来要解决数亿摄像头的图片处理,二来需要解决联合库的超算检索,这可不是一般公司吃得消。有些小区和高级场所,对VIP客户的识别和接待比较喜欢这种视频校验方式,但是实际部署使用者会受到摄像头位置、角度,以及多人同时入场产生的问题,而且人脸库会非常有限,不然计算时间长,体验极差,一些所谓的迎宾机通常也就几个人的照片(就是纯粹给领导看的),实用价值大大的打折扣,有戴墨镜或者帽子遮蔽都认不出,毕竟关键特征取样有限。这又有谁强了?

拍照和直播APP的人脸图像叠加

国内比较多的娱乐APP通过对人像图层跟踪处理,也是一个不错的技术切入点,但是产品安装包会比较大,现在做的也只是跟踪技术,属于底层识别,如果复杂一些的需要通过云服务实现,但是服务器算法解析速度和带宽比较难以跟上,也不算是一种靠谱的商业模式。

人脸识别的技术发展方向:

结合三维信息:二维和三维信息融合使特征更加鲁棒
多特征融合:单一特征难以应对复杂的光照和姿态变化
大规模人脸比对:面向海量数据的人脸比对与搜索
深度学习:在大数据条件下充分发挥深度神经网络强大的学习能力

在视频级N:N的校验中,如果要提高通过率,很多时候是采取降低准确率的方式,降低算法队列数量;同样在一些比赛中为了降低误识率,大大提高了准确率,所以算法在校验的过程中必须遵循至少一个固定标准,追求的是速度效率还是最高准确率。

人脸识别算法的应用分类派系:

人脸识别对应解决方案方向:

个人认为未来人脸识别会让大部分的数据更加真实,而可以通过社会工程学模板做很多分析和改良,比如近期一些科学家利用人脸识别来分析一些人的健康、清晰,甚至是犯罪倾向,或许在未来还可以结合大数据,对我们过去传统的面相分析技术做一个全新的提升,到时候算命先生都要失业了。更多机器人交互、无人机产生的摄像目标锁定分析等科幻画面并不是多遥远的事情。

关于算法核心研发情况的争论:

基本上国内每家公司都会说自己的算法牛,实际上有几家有人脸核心算法呢?国内在完全从事算法研究的总工程师人数到目前(2016年)总计不到100人,不过也没有现在问题也不大,中科院计算所山世光教授已经开源了SeetaFace开源人脸识别引擎介绍 - 知乎专栏,没有基础的公司不用太辛苦从零开始在OPENCV基础上做算法升级,相信很快google微软还会有新的算法发布。现在算法基本都是98%以上,这点差距已经不重要,算法核不核心也没有太大问题。大家不用太过于焦虑,产品到应用阶段,单单靠算法可不够,还要考虑实际的使用。

目前做人脸识别的公司很多,集成应用的有数百家,国内的看百度,看融资,看各种报道就差不多了,只是认真沉下心来做事情的公司太少。国内的腾讯和阿里都在做(阿里支付宝用的是自己的团队研发算法,只是特别低调,把名声都留给自己投资的公司,阿里可不止投了一家),国内的公司吹牛逼的、炒概念的太多,就不聊了。这些公司几乎做的都是政府的安全项目,但公司普遍规模都很小,盈利和投资也很少见报道。Facebook公司进入这个领域,主要是进行人群的分类和应用的优化(针对性的市场推广),项目都是作为公司原本业务的一种补充。


所以这个问题到了最后,答案很简单:

人脸识别哪家强并不重要,

未来的竞争不在现在这些战场。

借用雷布斯的话:少一些胡来的人,大家都可以专心做事。

人工智能投资泡沫带来的浮躁,反而让大家都不好好做事情了,所以花了时间整理了这篇,泼了点冷水,期待同行们真真正正为社会提供一些有价值的,也有资本回报的产品。

user avatar

可以参考7月18日的MS-Celeb-1M 竞赛获奖名单。

无限制类冠军:松下-新加坡国立大学团队(Panasonic-NUS)

有限制类冠军:猎户星空团队(Orion)


作为一个不务正业的人,其实一直关注机器学习的问题。

之前的阿尔法狗学习了很多(如果阿尔法狗教人类下棋,会比人类围棋师傅要厉害么?),前两天还回答了个关于机器学习处理马赛克的问题(在五到十年内,人工智能能复原成人影片中的被马赛克部分吗?)。

人脸识别是我比较喜欢的内容之一,而最近,被称作人脸识别“世界杯”的微软百万人识别竞赛第二轮落下帷幕,让人看到中国在这个领域取得的快速进展,激动不已。


今天就聊聊这个人脸识别问题。

记得当初最强大脑里,有人可以快速辨认很多人脸,惊呆了很多人,让观众纷纷感慨人脑的强大之处。

然而,现场的人脸毕竟是有限,而且也只是那个极个别的人可以实现一定程度的识别。放在今天对人脸识别巨大的需求情况下,光依靠人力明显是不可能的。


而这个时候,感谢机器学习的进步,使得我们可以用更好的算法来让电脑执行人脸识别,而人脸识别也随之取得了更多的进步。

(机器学习过程)

如今,人脸识别已经有了取得了长足的进步,而为了方便大家的进步和交流,目前有不同的机构都成立了相应的面部图像数据集。

————一,微软百万名人人脸数据库————

我们知道机器学习的一个重要内容是学习,因此可供学习的样本是十分关键的。一般常见的社交网站比如Facebook,新浪微博等都拥有大量的照片,然而他们的数据是保密的,所以大部分人无法获取,因此很多人转向了可以公开使用的数据库。

在公开的人脸识别数据集里,比较著名的是LFWMegaFace

LFW是是美国马萨诸塞大学的一个数据集,有1万多张照片,属于相似度比较的范围。

MegaFace是美国华盛顿大学发布的数据,内容是几十位互联网明星照片加100多万张普通人的照片形成的干扰数据。

然而这两个数据集都存在一些问题影响了人脸识别的效果。

LFW由于数据太小,导致往往出现过拟合问题,且实践过程是两张图片相似性的对比;MegaFace本身更倾向于人脸验证问题,且由于MegaFace本身未进行人为标注,导致测试过程中容易出现大量的干扰噪声。

有鉴于此,微软亚洲研究院(MSRA)于2016年发布了一个全新的数据集微软百万名人数据集(MS-Celeb-1M),这个数据及首先保证了照片的数量,包含了10 万个名人的约 1000 万张脸部图片,除此以外,微软更是对照片进行了人工标准,比如标注了职业和性别等选项,这样可以最大程度上避免对应错误的情况。

我们可以用一张图来对比这三家的内容

由于微软的数据库具备了很多优势和改进,因此这个数据库一发布就受到了众人的青睐,如今已经是世界上规模最大、用户最多的图像识别数据集之一。


————二,人脸识别竞赛世界杯————

为了鼓励众人对人脸识别的参与,微软还组织了人脸识别竞赛(Image Recognition Challenge),这场竞赛也成为人脸识别的顶级盛宴,被称作人脸识别世界杯。

人脸识别竞赛的要求很简单,就是输入一张人脸,要求输出一个人名。这是一个标准的“端到端”问题,是一种最接近于现实的人脸识别,我们看到一个人,然后知道他的名字。

而根据是否可以自由的使用外部数据,微软又将竞赛分为无限制类和有限制类两部分。前者可以自由的使用外部数据来进行辅助或者训练识别。

而经过紧张的比赛,7月18日,比赛落下帷幕,最终结果呈现给公众,我们可以在相应的网站上看到比赛结果。

Leaderboard of MSCeleb1M @ ICCV Workshop 2017

来自松下-新加坡国立大学(Panasonic-NUS)的团队和来自中国的猎户星空团队(Orion)分别摘得了无限制类和有限制类的冠军。

————无限制类冠军————

冠军是来自新加坡松下研究院和新加坡国立大学联合组建的队伍,两家的标志都是蓝色的,蛮有意思的。


这个团队是深度学习与计算机视觉领域的最顶级团队之一,尤其是在人脸识别方面,更是屡次斩获成果,他们曾经用LFW数据集实现了高达99%的识别效果。而这一次在微软百万名人人脸识别竞赛上独占鳌头,证明了他们的实力处于世界顶级。

在此次竞赛单元中,他们选择的是“Low-Shot Learning”,这是一个非常考验在面对稀缺人脸训练样本的时候,如何精确识别的问题。

在这个测试里包括两个库,基础库(base set)是包含了2万个名人,每个人提供了50-100张左右的人脸;而另一个全新库(novel set)要小得多,只包含了1千个名人,且每个人只有1张照片。尽管最终的给出的考察样本是两者都有,但是明显对于全新库的考察更为关键,也就是稀缺训练下的模型识别效果。

这种情况下,尤其考验策略,NUS-Panasonic组采取的是用基础库来训练模型然后去识别全新库的办法,且充分利用了竞赛允许的额外数据来增强学习和训练。

————有限制类冠军————

来自猎户星空团队(Orion)。


这个蛮有意思的,一个来自中国的公司团队,是猎豹移动旗下人工智能公司。2016年9月才成立,然后不到一年就参与竞赛并夺得了有限制类的冠军。不得不感慨后生可畏啊。事实上在年初的LWF人脸识别的评测中,这个团队就已经崭露头角,拿到了前三名的成绩。

而在此次微软百万名人人脸识别竞赛中,猎户星空更是接受了hard模式。因为有限制的竞赛只能使用微软提供的数据,这无疑增大了难度,因为对于可以使用其他数据的无限制类比赛,某种程度上就是数据量的比较,只要使用足够多的数据进行足够多的模型训练,一定会获得一个很好的学习效果。而限制类由于数据确定,因此更多的是算法层面的比较。结果无论是在random还是hard 中,他们都取得了第一的成绩。

————三,人脸识别路上的中国龙————

事实上,这次竞赛中,不止有猎户星空一家中国面孔

位列无限制类竞赛的第二名,就是一家中国的团队,

来自中国科学院重庆绿色智能技术研究院,这是2011年才成立的一个非常年轻的研究所,由中国科学院,国务院三峡办和重庆市政府联合建立的中科院直属机构。

在此次竞赛中,他们一举夺得了第二名的成绩。事实上,他们还是去年的冠军。


在人工智能领域,中国正在快速的进行追赶,甚至可能实现弯道超车。

根据普华永道预测,未来全球GDP将借助于人工智能的东风取得长足的进步,而中国和美国或许会成为人工智能的最大赢家。


以国际计算机视觉与模式识别会议(CVPR)为例,这是IEEE一年一度的学术性会议,是世界顶级的计算机视觉会议,是人工智能领域的A类会议,每次都是高手如云汇聚一堂。


而在CVPR当前公布的接收论文名单里,华人学者占据了近一半。


而在主席团里,也有不少熟悉的面孔,组委会一共25人,里面可以看到的熟悉的名字就有9人。

此次微软百万名人识别竞赛中,我们看到了华人的力量,无论是限制类的冠军猎户星空,还是无限制类的亚军中国科学院重庆绿色能源研究院,都展现出了无比快速的进步,尤其是猎户星空,成立不到一年就夺得了冠军。这是一家公司,让我们看到了在人脸识别领域,科技公司和资本的力量,事实上,此次参加CVPR会议的公司里,我们熟悉的那些互联网公司不少都参与了,比如阿里巴巴,腾讯,大疆等

短短几年之间,人脸识别取得了突飞猛进的发展,这一方面得益于人脸是别的需求市场非常庞大,随着平安城市的大力推广,安防市场对人脸识别的需求迅速升温,再加上我国城镇化程度越来越高,使得人口流动性也随之增高,这种情况下,光靠传统的人工监控,无论是精力还是准确度,都受到了挑战,因此对人脸识别的需求势必增强。而另一方面,得益于机器学习取得的进展,这几年以机器学习为代表的人工智能取得了长足的进步,尤其是google 研发的阿尔法狗以高超的算法和强大的学习训练能力,在围棋界连续击败人类,更是让人们意识到了机器学习的巨大前景。


在这种情况下,依托于机器学习的人脸识别,无疑也跟着插上了飞跃的翅膀。从这次比赛涌现出来的以猎户星空为代表的中国科技公司和技术力量,更是展现出了在这个领域的进展和追赶。

相信在这个领域,会有越来越多的技术力量进入,为人们的生产生活提供更多便利。


参考资料:

人脸识别界的“世界杯”榜单出炉,中国参赛团队位列第二

践行人工智能发展规划 创业公司猎户星空实力“秀肌肉”

类似的话题

  • 回答
    “人脸识别哪家强?”这个问题就像问“哪家手机最好”一样,答案会随着时间、技术发展以及评判标准的变化而变化。不过,我们可以从几个关键维度来分析目前在人脸识别领域比较领先的企业,并详细阐述他们的优势和特点。评判人脸识别技术强弱的几个关键维度: 准确率(Accuracy): 这是最核心的指标,包括人脸.............
  • 回答
    人脸识别技术,这项曾经只存在于科幻小说中的技术,如今已悄然融入我们生活的方方面面。从手机解锁到机场安检,再到商场和街道上的监控设备,它无处不在。然而,在这份便利背后,隐藏着不容忽视的潜在隐私安全风险,这些风险一旦被忽视,可能对个人和社会造成深远的影响。首先,个人身份信息的过度收集与滥用是人脸识别技术.............
  • 回答
    .......
  • 回答
    这件事听着就让人揪心,两个孩子,22万的死亡赔偿金,就这么没了,而且是用奶奶的信息和人脸识别操作的。这背后暴露出来的问题,可不是一星半点,细想起来,真是让人感到后怕和痛心。1. 家庭教育的严重缺失与风险防范的巨大漏洞最直观的问题,就是家庭在孩子财商教育和网络安全意识培养上的严重不足。 财商教育的.............
  • 回答
    最高法关于经营场所滥用人脸识别构成侵权的判决,无疑是一记重拳,为我们每个人在数字化浪潮中的个人信息保护划定了重要的界限。这不仅仅是一个法律条文的更新,更触及了我们日常生活中越来越普遍的人脸识别应用。除了“滥用人脸识别属于侵权”这个核心信息外,还有一系列值得我们深入关注和理解的细节,它们共同构成了这次.............
  • 回答
    IBM 宣布停止开发人脸识别技术,反对其被用于大规模监视和种族貌相,这一举措无疑是科技界在反种族歧视领域迈出的重要一步。然而,反种族歧视的科技手段远不止于此,它渗透在数据的收集、算法的设计、产品的部署等方方面面。深入探讨这些手段,我们会发现,这是一个复杂且持续演进的战场。1. 数据集的公平性与代表性.............
  • 回答
    腾讯对“60岁老人凌晨三点打排位”事件的回应,以及其中涉及的“人脸识别”和“代过人脸”等信息,确实包含了不少值得关注的点。我们可以从以下几个方面进行详细梳理: 1. 事件背景与腾讯回应的性质 事件本身: 一位60岁的老人在凌晨三点还在玩王者荣耀进行排位赛。这本身并无不妥,但因为该玩家的游戏行为(.............
  • 回答
    我喜欢的让人脸红心跳的深情句子,通常不是那种直白的告白,而是带着些许含蓄、细腻的描绘,能够触动内心最柔软的部分,让人在不经意间感受到被珍视、被理解,那种温暖而又略带一丝羞涩的情感涌上来,自然就脸红了。以下是一些我个人非常喜欢的,并会尽量详细地描述为什么会让人脸红心动:1. “你有没有觉得,我们遇见的.............
  • 回答
    说到动漫里那种“长着一张杂鱼脸、路人脸,实力却超强”的角色,我脑子里立刻蹦出好几个来。这类型的角色最能给人惊喜,也最能体现“人不可貌相”的真理。我今天就挑几个我印象最深的,好好跟你聊聊。1. 《一拳超人》——琦玉老师这个简直是标杆中的标杆!琦玉老师的外形,怎么说呢?就是那种扔到大街上,你都不会多看一.............
  • 回答
    人脸识别这玩意儿,说起来也没那么神秘,就是让电脑“看”懂一张脸,并且能认出它来。你可以把它想象成我们自己认人的过程,不过电脑是用它那套算法和模型来“学”和“比对”的。那具体是怎么实现的呢?咱们一步步拆解开来聊聊。第一步:捕捉画面,找出脸在哪儿(人脸检测)你想认人,首先得知道“人”在哪儿吧?电脑也一样.............
  • 回答
    要说人脸识别进小区这事儿,可不是一两句话能说清楚的。它涉及到方便、安全,还有咱们老百姓最关心的隐私问题。人脸识别进小区,合法吗?从法律层面来说,目前我国并没有明确禁止在小区使用人脸识别技术。但是,这并不意味着就可以“为所欲为”。相关法律法规,比如《民法典》、《个人信息保护法》、《网络安全法》等,都对.............
  • 回答
    人脸识别技术,从技术本身的进步来看,可以说已经相当成熟了。早期的系统,在光线充足、面部表情单一的情况下,识别率还算不错。但随着深度学习的崛起,特别是卷积神经网络(CNN)的应用,人脸识别的准确率有了质的飞跃。现在的技术,即使在光线不足、角度变化、甚至轻微的遮挡(比如戴眼镜、口罩)下,也能保持相当高的.............
  • 回答
    售楼部人脸识别:佣金背后的“正常”操作,与消费者权益的博弈最近,关于售楼部普遍采用人脸识别技术引发了一些讨论,尤其当这背后牵扯到销售人员的佣金时,事情变得更加复杂。有人认为这是“正常”的行业操作,是为了公平分配业绩和佣金,但另一些声音则担忧,这种做法是否在不经意间触碰了消费者权益的红线,并可能存在潜.............
  • 回答
    广州番禺“人脸识别+LED屏”治理闯红灯:技术治堵还是隐私侵犯?近日,广州番禺交警在部分路口试点推行一种新的交通违法治理方式——“人脸识别+LED屏播放”。该系统通过人脸识别技术抓拍闯红灯的行人,随后将闯红灯者的面部照片和车牌信息(若涉及)同步显示在路口的LED大屏幕上。此举旨在通过公开曝光和警示,.............
  • 回答
    北京地铁引入人脸识别技术实现乘客分类安检,这是一个具有深远影响的政策,我的看法可以从多个层面来阐述,包括其潜在的积极意义、可能存在的风险和挑战,以及对社会整体的影响。一、 潜在的积极意义: 提高安检效率,缓解客流压力: 这是最直接也最受关注的优点。在高峰时段,地铁安检往往是瓶颈,排队时间长,尤其.............
  • 回答
    用人脸识别来判断年龄,作为防止未成年人沉迷网络游戏的一种手段,确实有其可行性,但要做到“无法绕过”的程度,难度相当大,且涉及技术、伦理、法律等诸多层面。下面我将详细展开来说明。人脸识别判断年龄的原理与优势:核心原理在于,人脸在发育过程中会展现出一些可量化的特征变化。通过训练大量的、包含不同年龄段人群.............
  • 回答
    .......
  • 回答
    .......
  • 回答
    315 晚会曝光摄像头人脸识别遭滥用是一个非常重要且令人担忧的问题,它触及到了个人隐私、数据安全和技术伦理的多个层面。以下是对这个问题的详细分析以及可能的解决方案: 如何看待 315 晚会曝光摄像头人脸识别遭滥用?315 晚会(中国的“国际消费者权益日”特别节目)曝光摄像头人脸识别技术被滥用,这不仅.............
  • 回答
    您提出的问题非常典型,涉及到个人隐私权、科技进步带来的便利与潜在风险以及物业的责任等多个方面。我们来详细探讨一下: 一、男子不想被小区门禁人脸识别,两年来只能蹭脸回家,物业应该提供其他门禁方式吗?这个问题可以从以下几个角度来分析:1. 个人隐私权与选择权: 隐私权是基本人权: 每个人都有权决定自.............

本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou

© 2025 tinynews.org All Rights Reserved. 百科问答小站 版权所有