百科问答小站 logo
百科问答小站 font logo



为什么相比于计算机视觉(cv),自然语言处理(nlp)领域的发展要缓慢? 第1页

  

user avatar   thomas-ender 网友的相关建议: 
      

进化已经证明了,语言的门槛确实比视觉高得多。

世界上有多少种生物长眼睛,并且具备视觉识别能力?

无数种。

5亿年前的三叶虫都有眼睛。人类的眼睛结构比三叶虫精细得多,但光学上并没有什么本质区别。

5亿年间,各种不同形态的眼睛至少独立进化了50~100次。当然,长眼睛的生物必然有视觉识别能力,否则它要这两根铁棒有何用?

最简单的例子:苍蝇蚊子都有视觉识别能力,能自动避障,否则打个蚊子也不会这么难。

苍蝇蚊子的大脑只有20万神经元,人脑有800~1000亿个。细思极恐,20万神经元就可以完美实现自动追踪、自动避障,蚊子会坐电梯上20层,再从客厅追到卧室,一巴掌呼过去居然还会躲。

如果自动驾驶能达到苍蝇蚊子的智能,人会大呼卧槽,然后shut up and take my money。你见过哪只蚊子飞着飞着一头撞死在墙上,或者两只苍蝇为了抢屎在空中追尾吗?

CV最早的case好像是谷歌做的猫狗分类器,据说用了16000个处理器,内含10亿个节点。效果好得来,让当时的人大呼卧槽。

不过,这个级别的视觉识别能力,任何一只猫或一只狗都可以,连老鼠都可以。

可想而知,视觉的门槛有多低。

但是我们问:世界上有多少种生物会说话?

那基本上只有人类一种。

之所以说“基本”而非“绝对”,是因为有少数情况还不确定。比如黑猩猩可以用眼神+简单的手势交流,有人认为可以算“前语言”。还有人认为海豚可以用超声波对话,具体在说什么,到现在也没研究出来。

但是无论如何,所有人都公认:像人类这么复杂的语言,这个星球上没有第二个。

如果把500万年前作为人类进化的起点,那么人类学会直立行走大约用了200万年,学会使用工具用了250万年,学会用火用了400万年,学会说话用了480万年。

是的,仅仅20万年前,人类7号染色体上的“语法基因”FOXP2才刚刚突变出来。

即使有了500万年修炼而成的语言天赋加持,人类也不是一出生就会说话的。很多人学到20多岁,一门外语还学不明白,用母语写个800字的小作文都叫苦连天。

从商业角度,如果一辆车有了蚊子的视觉识别能力,肯定会有不怕死的想买来试试;如果摄像头有了一条狗的视觉识别能力,肯定会有人想买来看家护院。

但如果一个nlp AI有了10岁小孩的语言能力,除了拿100个诺奖,它好像也没有什么了不起的商业价值,连当个淘宝客服都会被买家差评。

因为nlp对标的是人,一个进化了500万年的人,一个成年人,一个有智商、有情商、有常识、最好还会多门外语的成年人,一个能区分“你这个睿智”和“你是一个睿智的人”的成年人。

大自然炼了500万年丹才勉强做到,每个人上了20年学才勉强做到,你一个搞nlp的发一篇文章就想取代人类?

nlp发展缓慢才是正常的,如果语言智能的门槛和视觉一样低,你现在不仅要学英语,可能还要学喵星语、汪星语、鸟语,上个厕所都得先跟苍蝇谈好价格。

但令人大呼卧槽的是,明明门槛这么高,nlp居然还是做出了有商业价值、让很多人能真正用得上的产品:

机器翻译。

很多人以为机器翻译肯定既懂中文、也懂英文,否则它怎么可能翻译出来?

但实际上,机器既不懂中文、也不懂英文,它只懂两种token之间的转换关系。在AI看来,它每天干的事情可能就像对对联:

上联:上海自来水来自海上
下联:Able was I ere I saw Elba

在无止境地堆算力、堆数据之后,AI竟然硬是走出了一条路,现在翻译诺贝尔文学奖的作品还不敢,但是翻译个论文资料已经完全可读了。

我最近就做了一个能直接翻译英文pdf的工具,不是划词翻译那种,而是一次性翻译整个文件,英文pdf进,中文pdf出。这样看论文就可以偷懒了~

链接如下,感兴趣的同学可以试试。目前只有PC版,APP的坑一直没填:

效果:

距离完美还很远,还有巨量的坑要填。但是至少不影响阅读,至少大多数用户觉得已经可以正经用了。

至于未来nlp的发展,我认为一种可能是达到“技术奇点”后,AI进入自我进化。也就是说,用AI训练出下一代AI,最终以人类无法理解的方式实现和人类语言能力匹敌的人工智能,甚至实现强人工智能。

另一种可能,就是继续堆料,继续缓慢发展,虽然这个“缓慢”相比其它行业简直就是闪电。


user avatar   wddddds 网友的相关建议: 
      

女王:求求题主放过我,我可不敢有什么政绩。。。


user avatar   xpqiu 网友的相关建议: 
      

女王:求求题主放过我,我可不敢有什么政绩。。。


user avatar   inprobabilitywetrust 网友的相关建议: 
      

女王:求求题主放过我,我可不敢有什么政绩。。。


user avatar   teng-gu-38 网友的相关建议: 
      

女王:求求题主放过我,我可不敢有什么政绩。。。


user avatar   johnzhang1999 网友的相关建议: 
      

女王:求求题主放过我,我可不敢有什么政绩。。。


user avatar   huo-hua-de-41 网友的相关建议: 
      

不请自来,关于Mac的使用,一周进步的编辑部一直以来都有自己的心得。很多人似乎都对MacOS存在误解,尤其是刚从Windows过来的朋友会极度不适应,但其实MacOS也有许多便人之处,只要你学会有正确的方式去使用它。


回答目录

1.系统辅助:Haptic Touch Bar、Alfred、manico、Mounty、NTFS、Dr.cleaner

2.效率办公:幕布、eagle、Paralles Desktop、WPS、XMindZEN、钉钉、Folx

3.影音播放:VLC、Camtasia、ScreenFlow、暴雪客户端、Mach Desktop


1.1.Haptic Touch Bar

Haptic Touch Bar是MacOS下一款能调节Touch Bar的声音、振动反馈幅度的软件,让你在使用Touch Bar的时候体验感更强,有一种好像在使用实体按键的错觉。(Tips:请在2016款或以上带有TouchBar功能的MacBook使用)

Haptic Touch Bar

1.2.Alfred

几乎是Mac必装的软件之一。它可以帮助你快速查找电脑文件、启动软件,你还可以用Alfred设置一些常用的Workflow,从而快速完成许多复杂的工作。比如:百度搜索、Google搜索、转换链接为二维码等。

1.3.manico

众所周知Mac打开多窗口后切换十分不方便,一个个点选缩小效率非常低。使用manico后可以获得像Windows一样的Tab栏,只需要使用快捷键commod+tab就可以在不同窗口间快速切换,速度非常快。

1.4.Mounty

很多刚接触Mac的用户经常都会有这样的疑惑:为什么我的硬盘无法读取?这是因为一般出厂默认的硬盘是NTFS格式,而Mac不支持这种格式,你需要安装相应的第三方软件,比如:Mounty、NTFS For Mac后,才能正常读取硬盘或者U盘。

除此外,还有一种操作是在Windows电脑中将硬盘格式化,然后修改格式为exfat,这样再在Mac中就能正常使用了。

1.5.Dr.cleaner

使用Mac几乎不需要杀毒软件,但同样需要一款清理软件。Dr.Cleaner就是一款免费但却非常好用清理工具,还能实时监测电脑的运行情况,非常方便。一般来说,免费版提供的功能就已足够使用,如果有深度清理的需求可以购买Pro版。



2.1.幕布

幕布是一款非常好用的思维导图工具。但它却和普通的思维导图工具不同,可以采用大纲的模式去记录笔记,同时可以转换成思维导图,而且还拥有Windows、Mac、微信公众号、网页端等多平台,同步速度也非常快。办公利器,值得推荐。

2.2.XMindZEN

说起思维导图自然少不了Xmind,但与传统的Xmind系列不同,新推出的ZEN系列非常轻便、好用。界面UI等也非常赏心悦目,使用起来有一种沉浸感,非常爽。

2.3.Paralles Desktop

有的时候我们难免逃脱不了需要使用Windows电脑进行办公,很多朋友也会选择在Mac里安装一个虚拟机以备不时之需。安装虚拟机推荐使用Parplles Desktop,安装起来非常简单,使用也非常舒适。

2.4.eagle

eagle是一款图片管理软件,如果你是一名设计师经常管理大量图片,强烈推荐使用。使用eagle你可以对Mac上的所有图片进行统一的管理,直接拖拽到PS等也非常方便,而且eagle也有Windows客户端。

2.5.WPS

WPS For Mac其实也是非常不错的工具,Office For Mac时常会出现许多bug或者卡顿的现象出现,非常影响效率。如果你的需求只是阅读和查看Office文档,可以考虑安装WPS。

2.6.钉钉

钉钉现在是企业办公市场第一,很多公司都会采用钉钉才进行办公协作,但其实作为个人用户同样可以使用。与QQ不同,钉钉不会限制登录的设备及数量,所以你可以在你任意的设备上登录钉钉,传文件起来就非常方便。

2.7.Folx

迅雷在目前来说,还是最方便的下载工具之一。但它的问题在于许多热门资源很容易失效或者限制下载,这时候往往我们替换一个磁力链接下载工具, 比如:Flox就可以了。



3.1.VLC

Mac上的播放器有很多,一般情况下quicktime就已经足够使用,但还是会遇到一些格式的文件无法打开,这时强烈推荐VLC,支持格式非常广泛而且还支持字幕导入。

3.2.Camtasia

Camtasia是一款非常好用的录屏软件,在Windows下同样也有,不过在Mac没有汉化。之所以说它强大是因为它不仅能完成视频录制,还能做后期剪辑、音频美化、字幕导入等功能,相当于简易的Premiere了。

3.3.Screen Flow

Mac下最为人广泛使用的录屏软件之一,相比Camtasia它对Mac的优化更好,使用起来也更人性化。

3.4.Mach Desktop

可以用高清Gif或者视频来作为电脑的背景,相当于Windows中Steam的wallpaper engine,只要找到高清的资源后,你的桌面就会非常炫酷。但同样这个软件非常消耗内存和电量,酌情使用。

3.5.暴雪游戏客户端

如果你想在Mac里玩游戏...那暴雪游戏客户端值得推荐,目前暴雪除了守望先锋外,所有游戏都有Mac版本。当然Steam也有很多适合Mac的游戏,也非常不错。

最后,说起MacOS常用的软件,大名鼎鼎的Adobe全家桶怎么能少呢?

关于MacOS软件就回答到这里,想了解更多关于办公、职场、效率的知识就关注我们吧。


更多阅读

Mac上有哪些冷门但逆天软件? (推荐)

还用Mac装win?你就out了。 (推荐)


一周进步〡年轻人快速突破自己的学习入口
微信公众号:关注「一周进步」(weekweekup)
青年兴趣课堂,每周一场训练营,欢迎关注,让我们一起进步
更多干货欢迎阅读:一周进步文章精选



  

相关话题

  如何评价朱广权battle AI手语主播?AI能否取代手语翻译,造福更多聋哑人? 
  分类问题的label为啥必须是 one hot 形式? 
  Siri有什么令人毛骨悚然的问题回答? 
  如何看待Hinton的论文《Dynamic Routing Between Capsules》? 
  如何看待马毅老师深度学习第一性原理的文章在 ICML 四个审稿人一致接收的情况下被 AC 拒了? 
  如何评价Yann LeCun宣称『他已经做好放弃概率论的准备』? 
  G7 忙着「秀」,有哪些值得注意的细节? 
  写深度学习代码是先写model还是dataset还是train呢,有个一般化的顺序吗? 
  如何将某个分布作为机器学习的特征? 
  如何看待70岁老教授花费2年时间让收藏在伯克利的中文古籍善本通过达摩院技术,以数字化方式回归故土? 

前一个讨论
西班牙拉帕尔马岛火山附近农民采摘香蕉满脸火山灰,他们在这种空气质量下会诱发什么疾病?
下一个讨论
中演协将吴亦凡、郑爽、张哲瀚等 88 人列入警示名单,你有什么想说的?还有哪些信息值得关注?





© 2024-05-20 - tinynew.org. All Rights Reserved.
© 2024-05-20 - tinynew.org. 保留所有权利