百科问答小站 logo
百科问答小站 font logo



如何评价谷歌 Pixel 4 新增「隔空手势操作」功能?与华为 Mate 30 Pro 有什么不同? 第1页

  

user avatar   dang.xinran 网友的相关建议: 
      

Google的Soli终于上旗舰机了。

作为很多年前的Project Tango开发者,真是老泪纵横。

要知道Project Tango是一个四五年前就非常成熟的RGB-D camera技术,当时搭载的平板非常昂贵,而且只有联想的一款商用机上成功搭载了。

Project Tango比iPhone X不知道早多少年的技术了,还更精确,而且主要功能是室内SLAM,非常非常精准好用。本质来说,Google Tango就是把微软的那个黑科技Kinect里的所有传感器再压缩,直到压缩成小手指那么大,然后放在平板的背部。

而Google比苹果不仅更早,整个宏伟蓝图也更远大:Google想做室内SLAM的顶级完美解决方案。你能想象2015年在Google Play上就有几十款精确基于室内SLAM的VR/AR游戏吗?都是基于Tango平板开发的,全都是像我一样的开发者们自愿想到各种创意然后提交到Play Store供大家免费下载来玩的,可惜这个技术始终没有正式大规模商用,最终SDK没有完成,而且把整个RGB-D的approach给取消了,整个反而拥抱了更低级、更不精确的单摄像头+IMU方案。

Google就是美有自己的硬件品牌,所以无数好硬件都被雪藏了,最后Tango整个项目组都被砍掉了。

我心疼的不只是Project Tango,而是无数个被Google内部在某个阶段被砍掉的项目,他们本来都有可能像Soli一样面世的,只不过Google没有自己的消费级硬件,这些项目和技术永远没有机会重见天日。

能搭载上Google Pixel 4这个级别的成熟产品,是Soli的幸运。


user avatar   tiancaomei 网友的相关建议: 
      

利益相关:我们组在做毫米波雷达的HAR。

WoW!差远了好吗!实验室做HAR的师妹表示超级兴奋,Google的Soli项目终于在商用产品上实现了!

比起Mate 30 Pro的视频处理,我们做信号处理的觉得这才可以被叫做可以带起来一个行业的黑科技,虽然已经黑了好几年。近些年其他厂商也有了类似的产品。

先回答一下问题,同样都是在解决Human Activity Recognition问题,Pixel 4的实现方案是毫米波雷达,而华为的Mate 30 Pro实现是视频传感器。硬件上的主要区别是传感器不一样,不过也正因为传感器不一样,所以它的应用范围、优缺点和相应的算法并不完全一样。

应用范围

Human Activity Recognition (HAR)在智能家居、自动驾驶、人机交互等方面一直都有非常广泛的市场需求,主要目的是通过各种传感器来识别用户行为,这里的传感器包括加速度计、陀螺仪、雷达、UWB、红外线等[1]。因为计算机视觉和深度学习的广泛发展,基于视频和图像数据的HAR是目前主流,华为在Mate 30 Pro上实现的就是这种;这个领域的发展也可以类比自动驾驶,目前自动驾驶中视频信息处理依然是主流。

HAR的主要问题是行为感知,当一个人运动时,其运动带来的多普勒信息可以由反射/散射的雷达回波表征,经过雷达的射频前端信号处理之后,二维特征可以用于处理和识别。

这些二维特征可视化之后,如下图[2]

而这些多普勒信息在图像传感器中的表征方式只能先对单帧做目标识别、再比对连续帧才能获得,获取成本比雷达要高很多。

优缺点

雷达相比摄像头,主要有五个优点:

  • 识别速度特别快:受限于端侧算力以及视频所能表现的丰富信息,视频处理的Pipeline需要分为检测、分割、精准识别、比对等多步神经网络计算,因此延迟很大,在Mate 30的手势识别上明显感受到;雷达处理主要是距离-多普勒域/时间-多普勒/或者时间-距离-多普勒信息,对于目标运动特别敏感;目前Soli的帧检测速率大约是18000FPS,这远远超过摄像头计算机视觉所能达到的速度。
  • 不受光照影响:雷达传感器是主动型设备,不需要外在光源/电磁波源支持
  • 数据隐私性好:一般来说,雷达主要用于识别动目标,毫米波雷达传感器精度难以达到图像级别,精度大约在厘米到数百毫米(看算法);换句话说,原始数据每帧中是难以识别出目标的精细特征的,而HAR中主要对比的是动目标带来的多普勒信息,识别物体的运动幅度精度可以达到20mm左右。这个其实和青蛙识别动目标的现象很像。
  • 可以穿越障碍物:这个就很好理解了
  • 360度检测:摄像头只能检测手机前方的物体,而雷达有能力360度发射电磁波脉冲(毫米波雷达的方向性很强,但是有能力做360度扫描,摄像头并无可能)

缺点:

  • 频谱问题:目前商用的毫米波雷达主要是24GHz、60GHz、77GHz几种,这些频段大都未经无线电管理部门授权,Soli的频段是57-64GHz。
  • 额外的硬件:在手机上增添毫米波雷达或占用部分射频空间,在很早的时候,Soli项目大小大约有收音机那么大,2016年左右发布的Soli雷达大约有8mm x10mm,集合了2T4R射频,现在应该更小。
  • 硬件算法都需要重新设计:如果说使用摄像头做传感器的好处是可以直接改开源代码,俗称站在巨头肩膀上,那么Soli项目的难度大约是自己站起来成为巨头。

Soli

Soli项目大约在2015年I/O大会公布,是谷歌先进科技与计划部门(ATAP)开展的实验性项目之一,2016年左右初代产品已经接近成熟,一直在解决各种细节,不过阻碍该项目发布的最关键问题还是频谱授权

主要原因是谷歌认为自己的设备峰值全向辐射功率(EIPS)会超过10dBm,至少会达到13dBm,而美国FCC认为EIPS如此高的60GHz设备使用会影响该频段的卫星、飞机和60GHz Wi-Fi。不过好消息是FCC在今年元旦批准了谷歌的手势操作感应系统:“Soli项目” 所申请的毫米波雷达57-64GHz频段(EIRP>13dBm)。相信这也是大家今年可以在Pixel 4上看到Soli的原因。


我们之所以说Soli很黑科技,是因为它首次用短距离FMCW 雷达和ML做出了端到端的的HAR pipeline,现在已经带起了一个小研究领域 [3]

它做的HAR pipeline是先对雷达收集到的Raw数据进行快-慢时间信息提取,就是上图中的第二步,我们展开来看雷达Raw数据信号变换之后是这样的:

在上图中,A,B是形状不同的物体在距离-多普勒域(R-D)的表征,可以看到几乎一致,这说明物体的形状不影响雷达信息识别,可以很好的保护隐私。而C和D代表极为微小的变动也会引起距离-多普勒域的信号强度大幅度变化。上述数据经过堆栈之后会输入神经网络处理,google称之为Gesture Recognition单元:

最初的Gesture Recognition 由CNN+RNN组成,在RNN过程中会进行时间序列堆栈,通过Softmax输出,这样简单地网络识别精度大约有87%。当然State-of-the-art结果比这个要高很多,分场景和采用特征图不同,大约91%-97%[4][5]不等。


如果Soli项目为代表的雷达HAR能够顺利产业化,把毫米波雷达芯片实装入手机的话,我们能看到太多有前途也很有趣的应用了,手机不仅能成为未来的随身计算中心,也有望成为未来的感知中心,我们原本有心无力的各种基于近场定位的应用,和AR/VR中的手势操作、姿态感知甚至是空中键盘输入等等等等都有望成为现实。

不过更现实的是,雷达领域做深度学习和行为识别的同学都很兴奋,自己的工作终于看到了前途/funding看到了希望。

2333333.

参考

  1. ^ Li X, He Y, Jing X. A survey of deep learning-based human activity recognition in radar[J]. Remote Sensing, 2019, 11(9): 1068.
  2. ^ Kim, Y.; Ling, H. Human Activity Classification Based on Micro-Doppler Signatures Using a Support Vector Machine. IEEE Trans. Geosci. Remote Sens. 2009, 47, 1328–1337
  3. ^ Wang S, Song J, Lien J, et al. Interacting with soli: Exploring fine-grained dynamic gesture recognition in the radio-frequency spectrum[C]//Proceedings of the 29th Annual Symposium on User Interface Software and Technology. ACM, 2016: 851-860.
  4. ^ Zhou, Z.; Cao, Z.; Pi, Y. Dynamic Gesture Recognition with a Terahertz Radar Based on Range Profile Sequences and Doppler Signatures.
  5. ^ Jokanović, B.; Amin, M. Fall detection using deep learning in range-Doppler radars. IEEE Trans. Aerosp. Electron. Syst.

user avatar   ying-fei-ling-25 网友的相关建议: 
      

稍微多说两句。

其实华人在海外,尤其是欧美社会遇到的很大的一个问题是意识不到种族的重要性。近代以前,中国基本都是处于一个“国家=天下”的状态。这就导致了很多中国人在面对近现代以威斯特法伦体系为基准形成的“民族国家”没有形成一个明确概念,因而在欧美,尤其是在北美(USA/Canada)这种移民国家里生活的时候政治上十分受挫。

不管你承认也好,否认也罢,一个人在美国的社会认定更多地来自于一个人的种族(race)而非阶级(class).以我们最关心的教育为例:大学录取会很大程度上根据你的种族来决定录取标准,而不是社会阶层,更不是政治倾向。不管家境如何,只要你是亚裔,那么你就有大概率碰到录取标准的歧视问题。

在这个前提下,任何一个有智商的人都能够看出来:在美国这个大背景下,在争取自身(个人/族群)权益的过程中,种族的优先级是排在最前面的,其次才是政治倾向和意识形态。因为大多数情况下你在填表的时候,不会让你选你是conservative还是liberal,只会让你选你是“white",“Asian”还是“Hispanic”. 而事实上,只要一个族群能够意识到美国社会种族优先的前提下,内部的政治光谱不仅不是问题,反而是优势,一个很好的例子就是犹太人。

犹太人在美国有多成功想必不用多说。但是犹太人并没有把自己局限在左翼或者右翼,而是通过在不同政治光谱上的发展,成功的让自己的种族在美国取得优势。说右翼,犹太人里面的一大票银行家企业家大家也有所耳闻;说左翼,犹太人中的囧叔,主持界传奇larry king,喜欢谈笑风生的华莱士等等都是业界传奇。这样他们右手掌控了经济和政治力量,左手掌控了舆论和传媒的力量,最终让族群取得成功。可见,以族群利益为先,则族内各个政见派系均受益;以政见利益为先,则族群分崩离析。

反观以叫兽为首的旧华“精英社会活动家“是怎么做的呢?不仅不去积极组织和联络真正能起到作用的政治基本盘(一个越来越壮大的华人群体),反而主动地去做出例如:损害自己族群的利益以换取一小撮外部政治利益(SCA5),试图不断的分裂族群内部力量(亚裔内部细分法案)等等赤裸裸乃至荒唐可笑的背叛种族利益的行为。这种叫兽,如果不是脑子进了水,那就只能是因为政治觉悟和政治水平实在太差,吃枣药丸


----------------------------


断脊之犬,狺狺狂吠。 一开始看到这篇文章我特别震惊,不单单是文章内容,更重要的作者身份:美国百人会会长及首个法学院院长?这样的人竟然说出如此粗鄙之语?不过回想一下,这倒是解决了我一直以来的疑问。

作为一个在美国各个领域都有杰出贡献的种族,作为一个平均收入和学历都远超平均线的种族,作为一个贡献了马友友,关颖珊,刘玉玲等杰出人才的种族,为什么美国华人的政治地位如此的低下?为什么华人的权益总是受到系统性的侵害和歧视?最重要的是,为什么华人,尤其是旧华人及其后代的自我认同和民族荣誉感低到令人发指?现在看来,这些旧华人中的“精英”“社会活动家”政治水准低到不堪占了很大一部分原因

其实在美国待过一段时间的人都明白,各个族群之间有竞争,有合作,也有斗争。但得到尊敬的条件只有一个:拥有力量。这个力量可以是经济力量,可以是知识力量,当然也可以是政治力量。所以这次大选华人主动出击,参与助选的行为我是非常认同的:重要的不是你站在哪一条队,而是展现能够左右选战结果的政治力量,这才是华人赖以发展的基础。相反,任何一种任凭意识形态洗脑而站队的行为都是政治水准低下的弱智行径。

其实稍微看了看叫兽的个人经历,未免有些可怜他。作为一个数次试图否认和摆脱自己华人身份的“社会活动家”,他的“习得性无助”十有八九也是在成长的过程中一步一步建立起来的。在中国崛起,新华人一步步向前的大背景下,他就像一头曾经被锁链拴住的幼象,完全没有意识到力量的对比总是会转化的,而华人政治家真正的基本盘只有自己。在这种情况下,旧华人的社会认知,一种貌似平等实则歧视的社会认知,只会进一步地被抛弃,最终由新华人引领实现真正的社会平等。旧华人畏畏缩缩的活了一百多年,却连美国这个国家的一点基本精神都没有学到,而这些分明写的很清楚:The land of the free and the home of the brave.

毕竟,大清都亡了,也请你们这些遗老遗少们滚回历史的尘埃里吧。 -------------------

原答案

这个所谓教授才真是把“歧视”二字阐释的淋漓尽致。




  

相关话题

  如何看待二百多名 Google 员工成立工会Alphabet Workers Union? 
  想去谷歌 大学应选择什么方向? 
  如何评价Google Duplex(打电话AI)在特定领域已经通过了图灵测试? 
  如何看待Google解散Google Health团队?IT/AI大厂在医疗领域未来前景如何? 
  如果谷歌、腾讯、阿里、百度这样的企业被删库跑路,会发生什么? 
  为什么同样是搜索引擎的巨头,百度的市值仅 667 亿美元,而谷歌市值为 5147 亿美元? 
  如何看待AI伦理科学家Timnit Gebru在邮件控诉谷歌缺乏种族多样性后被Jeff Dean炒掉? 
  Google Play Music 现在还能用吗?如果还能的话,具体该怎么使用? 
  为什么微软的网盘Onedrive不像百度网盘一样支持秒传呢? 
  如何看待 Google 既可以作 Inference,又可以作 Training 的新一代 TPU? 

前一个讨论
如何评价小米旗下首款曲面显示器?
下一个讨论
如何评价小米发布的 699 元 23.8 英寸显示器?是否值得购买?





© 2024-05-18 - tinynew.org. All Rights Reserved.
© 2024-05-18 - tinynew.org. 保留所有权利