进化已经证明了,语言的门槛确实比视觉高得多。
世界上有多少种生物长眼睛,并且具备视觉识别能力?
无数种。
5亿年前的三叶虫都有眼睛。人类的眼睛结构比三叶虫精细得多,但光学上并没有什么本质区别。
5亿年间,各种不同形态的眼睛至少独立进化了50~100次。当然,长眼睛的生物必然有视觉识别能力,否则它要这两根铁棒有何用?
最简单的例子:苍蝇蚊子都有视觉识别能力,能自动避障,否则打个蚊子也不会这么难。
苍蝇蚊子的大脑只有20万神经元,人脑有800~1000亿个。细思极恐,20万神经元就可以完美实现自动追踪、自动避障,蚊子会坐电梯上20层,再从客厅追到卧室,一巴掌呼过去居然还会躲。
如果自动驾驶能达到苍蝇蚊子的智能,人会大呼卧槽,然后shut up and take my money。你见过哪只蚊子飞着飞着一头撞死在墙上,或者两只苍蝇为了抢屎在空中追尾吗?
CV最早的case好像是谷歌做的猫狗分类器,据说用了16000个处理器,内含10亿个节点。效果好得来,让当时的人大呼卧槽。
不过,这个级别的视觉识别能力,任何一只猫或一只狗都可以,连老鼠都可以。
可想而知,视觉的门槛有多低。
但是我们问:世界上有多少种生物会说话?
那基本上只有人类一种。
之所以说“基本”而非“绝对”,是因为有少数情况还不确定。比如黑猩猩可以用眼神+简单的手势交流,有人认为可以算“前语言”。还有人认为海豚可以用超声波对话,具体在说什么,到现在也没研究出来。
但是无论如何,所有人都公认:像人类这么复杂的语言,这个星球上没有第二个。
如果把500万年前作为人类进化的起点,那么人类学会直立行走大约用了200万年,学会使用工具用了250万年,学会用火用了400万年,学会说话用了480万年。
是的,仅仅20万年前,人类7号染色体上的“语法基因”FOXP2才刚刚突变出来。
即使有了500万年修炼而成的语言天赋加持,人类也不是一出生就会说话的。很多人学到20多岁,一门外语还学不明白,用母语写个800字的小作文都叫苦连天。
从商业角度,如果一辆车有了蚊子的视觉识别能力,肯定会有不怕死的想买来试试;如果摄像头有了一条狗的视觉识别能力,肯定会有人想买来看家护院。
但如果一个nlp AI有了10岁小孩的语言能力,除了拿100个诺奖,它好像也没有什么了不起的商业价值,连当个淘宝客服都会被买家差评。
因为nlp对标的是人,一个进化了500万年的人,一个成年人,一个有智商、有情商、有常识、最好还会多门外语的成年人,一个能区分“你这个睿智”和“你是一个睿智的人”的成年人。
大自然炼了500万年丹才勉强做到,每个人上了20年学才勉强做到,你一个搞nlp的发一篇文章就想取代人类?
nlp发展缓慢才是正常的,如果语言智能的门槛和视觉一样低,你现在不仅要学英语,可能还要学喵星语、汪星语、鸟语,上个厕所都得先跟苍蝇谈好价格。
但令人大呼卧槽的是,明明门槛这么高,nlp居然还是做出了有商业价值、让很多人能真正用得上的产品:
机器翻译。
很多人以为机器翻译肯定既懂中文、也懂英文,否则它怎么可能翻译出来?
但实际上,机器既不懂中文、也不懂英文,它只懂两种token之间的转换关系。在AI看来,它每天干的事情可能就像对对联:
上联:上海自来水来自海上
下联:Able was I ere I saw Elba
在无止境地堆算力、堆数据之后,AI竟然硬是走出了一条路,现在翻译诺贝尔文学奖的作品还不敢,但是翻译个论文资料已经完全可读了。
我最近就做了一个能直接翻译英文pdf的工具,不是划词翻译那种,而是一次性翻译整个文件,英文pdf进,中文pdf出。这样看论文就可以偷懒了~
链接如下,感兴趣的同学可以试试。目前只有PC版,APP的坑一直没填:
效果:
距离完美还很远,还有巨量的坑要填。但是至少不影响阅读,至少大多数用户觉得已经可以正经用了。
至于未来nlp的发展,我认为一种可能是达到“技术奇点”后,AI进入自我进化。也就是说,用AI训练出下一代AI,最终以人类无法理解的方式实现和人类语言能力匹敌的人工智能,甚至实现强人工智能。
另一种可能,就是继续堆料,继续缓慢发展,虽然这个“缓慢”相比其它行业简直就是闪电。
本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度,google,bing,sogou 等
© 2025 tinynews.org All Rights Reserved. 百科问答小站 版权所有