百科问答小站 logo
百科问答小站 font logo



李彦宏批评推荐式算法,你怎么看? 第1页

  

user avatar   windycloud 网友的相关建议: 
      

有建设性的批评需要同时提供一些解决方案。

比如说你说有泥的地不能扫,不能扫怎么办呢?可以墩布去墩,八字法或者吉普赛舞步法等等。

做事的时候有问题,一般有两种,一种是不知道有问题,一种是知道有问题但是没办法解决只好这样。

李先生提出批评,但是没说可能怎么解决,只能靠我们自己理解。

当然你可以当他说了解决方案,而且是悄悄说的那种,那就是“那些懂自己要什么的可能在百度哦”。

百度不是投喂,而是不得法的情况有用的东西都搜不到。

假如没有知乎、头条、抖音这类内容推荐市的平台,尤其是百度作为搜索引擎推送有用的信息已经是有一些问题,百度践行谁给钱多就推荐读者看啥的思路,别说“投其所好”,就是少发点有害的信息,也是需要大刀阔斧的。

当然,如果只有搜索引擎,或者说只有Google也不行,至少对于大多数人不行,不然不会有 Facebook 这样的时间线产品机会了。

说一些“为谁谁”好的话很容易,比如说 多喝热水,比如说多穿秋裤。但是这类要求和批评不是好的沟通方式。

用户喜欢什么就推送什么,这是商业化本身推动的,如果你是一个非盈利性的图书馆平台,比如说国家图书馆做一个大型信息流的内容平台,那可以选择不用一定投其所好,可以按照编辑喜欢或者什么通识等等的要求来做,这时“编辑觉得你喜欢”或者“各类要求觉得你应该看”就变成“多穿秋裤”、“多喝热水”的变种。

当然,非盈利性的组织,也需要经费,也需要发工资,也需要有一些激励目标,不然人呆着分外没劲最后只能留下每天酣睡的工作人员们,如果说可以不用关注多少人看,那么可以关注深度阅读的比例或者影响,甚至培养出多少专家等等这类指标。

但是这种事情,更加如同彩票,中了当然开心,不中了怎么办,难道印几个横幅和彩旗强行授予?

搞不好最后一看,漫画专区和仙侠小说专区,扎堆了大量的深度阅读用户,每个人动辄百万字阅读量,评论区里对各类奇门遁甲、帅哥美女如数家珍。

最后估计只好以进了多少资料,整理了多少文献,甚至地板是不是每小时擦一遍,墩布是不是八字法拖地等等来不断做考核。

商业化机构,是消费者选择下生存的机构,这类机构一定会砍掉越来越多的冗余成本,追求收益,比如我们公司所在的办公区域,清洁工作也会由大楼统一管理,不会是每家公司自己雇佣八字法拖地的妇女,也不会不盯着用户活跃度和新增用户数跑去做一些命令式的东西,如果有,或者有过,一定是决策出过问题,换句话说,看错过。

获得一些可持续的收益之后一定会扩大规模直到能力范围的限度。那么不断找你最爱看的,而且是法律允许范围内的,简直是天经地义的事情。

作为消费者,坦然消费自己喜欢的东西,居然也会被批评、恐吓,如果不是恐吓式获客的全新手段,那就听来乐呵乐呵,当作茶余饭后的笑谈吧。


user avatar   cang-shu-da-bu-guo-song-shu-38-76 网友的相关建议: 
      

刚上高中时候,我接触了知乎,那时候它的推送方式比较简单,我好奇地阅读它给我推送的一个个有趣的问题,科普知识、人际交往、大开脑洞...那时候就有人在抖机灵。看知乎就像读一本有趣而又充满智慧的书,它让我认识到互联网传播知识的力量,也打开了我互联网学习的大门。


期间知乎更新过很多次,推送算法也越来越成熟,后来干脆只有使用知乎app才能看到所有回答了,一直到高三,它推荐的问题越来越单一,我是一个理科高考生,它天天给我推送相关的问题,虽然问题都比较简单,但答主们的回答也引起了我的深思并让我受益良多。


后来知乎越来越“智能”,高考出分当天给我推送志愿填报问题,追女票时期给我推送谈恋爱注意事项,进了学校推送大学生活之类的...甚至有一天我发现,我在打字谈论过什么话题或者和朋友们聊天时提到什么话题时候,知乎也会给我推送相关内容。


大学期间,它向我不断释放焦虑,选专业、评奖学金、保研、内卷、猝死......让我几次卸载又几次装回来......


李彦宏固然没有做到知行合一,但我觉得他说的还是有道理的,推荐式算法有着不可替代的作用,但滥用推荐式算法不仅不能“发现更大的世界”,反而使一个人沉迷奶头乐,固步自封,甚至可能走向毁灭。


user avatar   jay-16-44 网友的相关建议: 
      

2021-01-07

不得不说,李彦宏这个认知还是非常正确的。

仔细回想下,推荐算法还没兴起之前,国内网络上还是以中庸之道为主,讨论什么问题都是不偏不倚,调和折中。为什么?因为那个时候推荐算法非常弱,顶多是个svd,你看到的内容就是调和折中的,虽然杂,但什么视角都有。

推荐算法兴起之后,更甚者的是,加持了nlp中的sentiment analysis(情感分析),急剧的缩窄了每个人的视角,并且将你带向极端。推送算法会收集你的历史记录,不论是阅读记录,点赞收藏喜欢以及反对记录,根据这些记录的相关内容,去做内容分析情感分析(训练模型),给你推送最类似的内容。

长此以来,你只会也只能看到你想看到的,你的视角从一个面缩窄成为一条线,最后变成一个牛角尖一样的点,形成了自己的信息茧房。

当女生点赞了一个男女关系的内容,那可能下一个推送就是《一年赚不到五十万的国男配不上你》,如果恰巧你看爽了双击了屏幕,那么伯爵的回答将会长期充斥着你的知乎,后面就离加入咪蒙派不远了。

同样的,当男生阅读课一篇NBA相关内容后,大量nba文章回答会推送给你,再恰巧你点赞了一篇詹黑/科黑回答,那恭喜你,你可以在知乎看一辈子撕逼了。

近年来网络上的对立越来越严重,这绝对有一份推荐算法的功劳。


2021-08-28更新:

终于来了


user avatar   virtus-yang 网友的相关建议: 
      

·

在很多互联网巨头眼中,人嘴与猪口一样。

所有投行专家的图表、分析报告,只是计算猪饲料与猪肉的产出比而已。

他们仿佛说:

你把这些猪分栏(用户分群)关起来。

放够食料(针对用户喜好,进行养猪式投喂)。

那些猪便会相安无事,而天下太平,并且稳定产出猪肉(利润)了。

这种经营方式,在移动互联网爆发初期很有效,只要有稳定增长的用户,进行养猪式投喂,即可得到源源不断的利润。

但作为用户,我们感到,被常年过度灌食某种低端饲料,见到饲料都想吐。

李彦宏也是意识到了这一点,所以才批评这种“养猪式投喂”的推荐算法。

其实百度早就意识到,在移动互联网时代末期,几乎没有新增用户红利了,为了将用户和流量锁死在自家产品中,互联网巨头们就必须了解挖掘用户的深度目标和需求,而不是养猪式的投喂。

那么,什么样的推荐算法才是最好的呢?

深度学习推荐算法才是最好的。

所谓的深度学习,实际上是机器学习的分支,机器学习指的是:在没有明确编程的情况下使计算机获得学习的能力,则该研究领域可以被称为机器学习。

深度学习是机器学习的一个子集,基于神经网络技术,深度学习可以从原始数据直接学习、自动抽取特征、通过足够多的隐含层神经网络,对特征值逐层抽象,最终拟合极其复杂的函数,以实现回归、分类或排序等目的。

简而言之,深度学习,就是把海量答案投喂给计算机进行学习后,使计算机能自动解决类似的问题。

当然,机器并不能解决人类的所有问题,人类发明人工智能、机器学习、深度学习的动机,是让机器自动解决“可计算问题”。

简而言之,就是让机器替代脑力劳动,满足人类自身的惰性。

“可计算问题”是数学问题中的一个分支,数学问题又是“所有问题”的分支。所以“机器学习”和“深度学习”的本质是人工智能解决“可计算问题”的手段。

而与内容推荐相关的问题,恰恰是一种“可计算问题”,完全可以用深度学习的方式解决。

近些年来,人工智能深度学习技术在很多领域都取得了巨大的成功。学术界和工业界都在尝试将深度学习应用于个性化推荐系统领域中。

接下来,我们就介绍两种最知名的深度学习推荐算法:

YouTube的深度神经网络个性化推荐系统:

YouTube是全球最大的视频分享网站,其个性化推荐系统,为超过10亿用户从不断增长的视频库中推荐个性化的内容。

YouTube的推荐系统由两部分组成:

l 候选集生成:从百万量级的视频库中,为用户生成上百个候选视频。具体做法是,对于一个Youtube用户,使用其观看历史(视频ID)、搜索词记录、人口学信息(如地理位置、用户登录设备)、二值特征(如性别,是否登录)和连续特征(如用户年龄)等,对视频库中所有视频进行多分类,得到每一类别的分类结果(即每一个视频的推荐概率),最终输出概率较高的几百个视频。

l 排序:对候选进行打分排序,输出排名最高的数十个结果。

Youtube的深度学习推荐算法,本质上是让机器学习了地理位置、用户登录设备、性别、年龄等用户特征,与观看历史(视频ID)、搜索词的对应关系。

这样,当我们把地理位置、用户登录设备、性别、年龄等用户特征告诉计算机时,计算机就能预测出相应的观看历史(视频ID)和关键词了。

百度飞浆在YouTube算法的基础上,进行了升级,推出了开源的“融合推荐算法”。

飞桨是百度研发的我国首个开源开放、功能完备的产业级深度学习平台, 基于飞桨,百度大脑开放平台为中小企业提供各种易用的人工智能服务。

融合推荐算法

以电影为例,在飞浆的融合推荐模型的电影个性化推荐系统中:

首先,使用用户特征和电影特征作为神经网络的输入,其中:

用户特征融合了四个属性信息,分别是用户ID、性别、职业和年龄。

电影特征融合了三个属性信息,分别是电影ID、电影类型ID和电影名称。

然后,将用户对于电影的评分作为训练目标。

经过深度学习训练后的神经网络,就可以根据“用户特征”和“电影特征”,预测出评分了。

使用融合推进算法的电影推荐系统,可以预测出用户对电影的评分,然后将预测评分最高的电影推荐给用户。

深度学习的秘诀:

不仅是推荐算法,其实在深度学习的驱动下,人们在计算机视觉、语音处理、自然语言方面相继取得了突破,达到或甚至超过了人类水平。深度学习的成功的秘诀有以下三点:

1) 海量数据:深度神经网络基于大数据进行训练,市面上常见的商用语音助手,基本上都掌握十亿甚至百亿级对话库。从近期谷歌、微软和OpenAI的最新进展看,语料库的大小和能力成正相关,OpenAI推出的 GPT-3神经网络已经学习了45TB的语料,不仅可以更好地答题、翻译、写文章,还带有一些数学计算的能力。

2) 深度神经网络模型:深度神经网络的模型非常复杂,所以其能力也比传统机器学习更强,一般以参数量表示深度神经网络模型的大小,目前最复杂的用于NLP的GPT-3神经网络模型,其参数数量已经达到了1750 亿。

3) 大规模并行计算:

著名科学家 Richard S. Sutton曾说道:“回溯70年的AI研究,从中得出最大的经验是,利用计算力的通用方法最终总是最有效的,而且遥遥领先。

为了追求更好的效果,模型复杂度和数据量越来越大,计算成本也越来越高,根据谷歌发布的信息,研究者估计在训练 110 亿参数的 T5(谷歌 2019 年推出的预训练模型)变体时,单次运行成本就远远超出了 130 万美元。

而百度大脑则更为夸张,其硬件由数十万台服务器以及中国最大GPU集群组成。数据包括全网数万亿网页内容,每天数十亿次搜索数据,百亿级别定位数据。

有了如此强大的硬件基础,自然会创造出最优秀的成绩,在2020年3月落下帷幕的全球最大语义评测SemEval 2020上,百度ERNIE摘得5项世界冠军, 该技术也被全球顶级科技商业杂志《麻省理工科技评论》官方网站报道,相关创新成果也被国际顶级学术会议AAAI、IJCAI收录。ERNIE在工业界得到了大规模应用,如智能推荐、搜索引擎、新闻推荐、广告系统、语音交互、智能客服等。

各国政府早就意识到,人工智能可以达到或甚至超过人类水平。所以2013年美国政府启动“大脑计划”,同年,欧盟的人脑计划(Human Brain Project)入选了欧盟的未来旗舰技术项目。2017年中国国务院发布了中国2030年前人工智能系统发展计划,计划在2030年之前成为人工智能技术领域的世界领袖。2017至今,人工智能开源技术爆发、腾讯、百度、科大讯飞等企业也提供了人工智能云服务(也被称为人工智能开放平台)。2019年,我国人工智能企业数量位列全球第二。

科学家凭借无与伦比的创造技巧、以不朽的文明科技,仿造并超越了人脑机能。这是一项神圣的工程,而更为神圣的强人工智能技术,则矗立于世界文明的未来之巅,微笑着、等待着。


user avatar   lu-luce 网友的相关建议: 
      

不按照用户喜好推荐。难道要按照谁给的广告费多推荐吗?

这件事情当年雅虎就试过。雅虎天真的以为优质客户能够出得起广告费。

结果用户无论查找什么关键字。前十个链接都是卖性保健品和假药的。毕竟只有这种公司才是真正愿意出广告费的。


user avatar   LinkinBryant 网友的相关建议: 
      

推荐算法对于电商来说,在今年尤为热门。

这方面,抖音目前是技术上的领先、淘宝在追赶,知乎也在邯郸学步。

而百度在这里是什么位置呢?李彦宏为什么批评推荐算法?
因为他做不了啊,总不可能是因为他有良心、关心用户的信息自由和隐私吧(笑)
这几个词和李彦宏和百度有什么关系(笑)

做的最好的是抖音,因为他的产品是以视频驱动的。在追赶的是淘宝,因为他们是图文驱动的。当然淘宝这一年来发了疯的想在内容(特指短视频和直播,图文基本被抛弃)上进行追赶。小红书和豆瓣在这两个方面也在赶。

而知乎、百度基本上要么在邯郸学步,要么在望洋兴叹,因为他们是文字驱动的。

以至于我一度感叹,如果不会做视频、不会做图文,那我恐怕迟早要变成赛博文盲。


视频、图片、文字。
从有效信息的密度来说,是文字>图文>视频。
而单纯的从信息密度来说,是视频>图文>文字。

这决定了,抖音做推荐流,行。知乎做推荐流,不行。只能是把自己做成了百家号+UC。
以至于沦落到不断地推送百家号式的文章,沦落到在抖音上打广告标榜“上知乎写字捞金”



因为文字本身就是对信息的抽象,对于AI的训练非常不友好。基于大量文字的内容识别和推荐算法很难做,甚至我怀疑直接做不了。
相比之下,计算机视觉方面,美颜、视频美颜、人工换脸这一块的应用可以说是突飞猛进。基于计算机视觉的推荐算法更是制造了一个新的巨头字节跳动。

通过人工智能识别标签,进行人群圈选,很大程度上是助力了粉丝经济。

我们去年看了足够的美国笑话,看到川普带领着自己的信仰粉不断的整活。觉得好笑。
做电商的人看到川普就是大力锤掌,直呼内行。

什么叫粉丝粘性啊(战术后仰)
什么叫人群圈选啊(战术后仰)
什么叫粉丝唤醒、粉丝再转化啊(战术后仰)

人美国的大选都已经不再是单纯的比谁的支持者多了。那是流量电商时代的做法,我的转化率固定的,流量越大,成交越高。人多,投票的就多。
美国大选现在都玩内容电商的玩法了,反正再离谱也大不了就是从五五开变成四六开。那谁的支持者投票率高。谁的选票就多。川普大选之前歇斯底里的发推,VOTE!VOTE!VOOOOTEEEEE!,总不是给拜登支持者看的。无非还是推动人群转化,“OMG!买它!买它!买它!!!”

其实还不是给内卷逼的。人美国大选都卷成这样了,国内做流量生意的也只能全在这一条路上挤了:不论商家还是平台。


信息茧房这个词也说的很多次了,在信息茧房成型以后,信息回声效应会被极大的增强。
然后带来的是什么呢。是人自身会给自己做一个人群自限。
就好像有些人一翻星座书,自己是天蝎座老阴比,觉得很有道理,然后给自己树了个腹黑的人设自己往上面靠。

人群会根据自己的人群归属,做出符合这个人群的行为。

汉服JK不能穿山。潮男AJ椰子两双,SKrrr——搞说唱的要是只会check it out不会skr,那...那除非他是old school那一挂的。
小清新们被车厘子自由、奶茶自由、XX自由撵得上天入地,带了自由后缀的东西如果不买,就显得自己生活可悲、人生灰暗了一样。

这些是什么。这些都是...都是商机啊同志们。


user avatar   kaihuatang 网友的相关建议: 
      

不管李彦宏自己怎么做,单说这个观点对应到知乎这两年的问题上确实是说的很对了。我觉得根据用户喜好来推荐的系统只应该用于纯消遣的娱乐领域:游戏,动漫,电影。。。本来就是打发时间的,用户的喜好和品味长时间内也相对稳定,自然喜欢什么来什么最好。但是用在新闻,科普/观点(知乎),信息检索这些获取知识和信息的平台就不适合了,这些平台展示的要么是1)客观存在的东西,要么是2)有时效性的东西,强行划分只会约束用户的视野。而且上这些网站的时候,用户的期望本就不是寻求情绪上的刺激,加入诸如情感分析等模块,即便短时间增加用户活跃度,也只会降低用户体验,消耗长期潜力。至于一些比较综合的平台,比如B站,则应该划分好不同板块,分别处理(其实我觉得现在B站做的就比知乎好很多)。

从技术角度来说(我没做过推荐系统,这里说些瞎话),可能现有的推荐系统指标太局限,只是反应了用户的短期活跃度,并不能真正反映用户的长期体验。如果换一个长期的指标,说不定算法就会自然收敛到一个比较开放的,多元的解了。


user avatar   justjavac.com 网友的相关建议: 
      

梁思申家庭,从剧中的暗示来看,应该是49年之前的上海工商业者。他们家至少他父母这一支还算是爱国的,49年之后并没有跑路而是留了下来,属于政治上靠得住的工商业者,文革之后被国家启用。

这样的家庭基本上在海外都有亲属,改革开放之后才重新联系上,这也是梁思申改革开放之后选择移民国外的原因之一。

梁思申自视甚高,她说自己没有歧视,但宋运辉说得对,她就是歧视了。她确实想促成中国的发展,但另一方面她心里已经内化了西方资本的逻辑,她认为中国要发展,做西方的附庸就是理所应当的。她并不知道,也没想过,为什么重点国企必须由中国掌握控股权的原因,也不在乎,只要她能完成这笔投资,受到老板的表扬,她的价值就实现了。

剧中对梁思申这一路人的小心思写的是很好的。这就是改革开放中华人华侨的真实想法。

她和宋运辉的矛盾,不是谁和谁斗气,或者性格冲突,而是根本立场不同。对梁思申来说,单子能谈成,中国市场开拓出来,她就实现了自己在美国人中的价值;但是对宋运辉,他就必须考虑中国化工几年甚至几十年之后的长远利益,为了这些利益,政治底线是不能退让的。

梁思申说自己受了歧视,实际上和宋运辉说的歧视并不是一回事。梁说的,是她作为美国华人所受到的种族歧视,这种歧视,宋和大部分中国人当然没有体会,也没有理由就要体会。毕竟梁还是要在美国社会混的,宋和大部分中国人不需要。

宋说的歧视,则是西方大公司利用自己的优势地位,并不把中国当做平等的合作伙伴,而是趁机控制中国的经济命脉。这点,梁实际上是不在乎的。毕竟,就算控制了又能怎么样?梁还是吃香的喝辣的,大不了回美国去。

对吉恩一路人来说,梁当然就是个工具。毕竟买办永远也不可能和老板真的平起平坐。

当然,梁思申并不坏,我相信她主观上也是想为中国好的。但是她长期受美国的教育,认为中国处处落后,美国的一定先进,所以自己有先天的权力去决定东海应该如何如何,还自以为是为中国好,实际上就是个二鬼子。

宋运辉也不傻,这点他肯定早就看透了,但是为了合资,一直到吃饭之前都没捅破。宋也一直在和日本还有其他公司联系,该摊牌就摊牌,可见也没有对梁这边报不切实际的希望。


大结局了补充一下:最后两集说明梁的层次还是比宋差远了。她以谈判为要挟,不仅救不了宋,而且会让上级部门更加怀疑宋和梁有不正当的交易。她以为靠自己就能扳动洛达,靠一个洛达就能改变党的组织原则。而她实际上就是个工具人,不可悲么?

最后她和宋的谈话,宋对她是大失所望的。本来吃饭的时候,宋以为她回来投资是为了帮助中国的建设,结果因为她自己的一点私心,说不投就不投了。她看得上的人就行,其他中国人统统不行。我相信随着改革的深入,梁思申这种人如果不改变自己看问题的方式,会走到完全西化派的路子上。


user avatar   li-mu-gen-19 网友的相关建议: 
      

谢谢邀请。

北京冬奥会开幕好几天了,精彩绝伦的开幕式还时常浮现在我的脑海中……

大家心里都清楚,奥运会这种国际盛会,意义远远超出体育比赛本身。举办一次奥运会,本质上是大国综合实力的全方位体现,其中很重要的一部分就是科技实力。本次北京冬奥会确实出现了不少有趣的新技术,我感兴趣的则是云上全息通信技术让光学相关的“黑科技”得以更好发挥,比如昨天一个叫做Cloud ME(云聚)的“全息显示仓”,让国际奥委会主席巴赫出现在了2022北京新闻中心给全国观众拜年。

这个“全息显示仓”要实现的目标非常简单:让远隔千山万水(国际奥委会主席巴赫在北京、阿里巴巴CEO张勇在上海)的两个(或多个)人仿佛处于同一空间中进行交流。而且从实际的观看、拍摄与交流方面来看,对记者们来说,虽然两人都不在眼前,但效果上与他们俩站在面前几乎别无二致。

当然了,虽然新闻中名称叫“全息显示仓”,但实际上这是生活中广义上的全息,并不是物理意义上的。物理意义上狭义的“全息”是衍射成像的技术,但目前的技术还远远做不到理想的动态全息显示,这是整个光学领域圣杯级别的高难度挑战。

此次堪称黑科技的“全息显示仓”虽然不是严格的物理全息,但在立体感与真实感方面远远超出了目前普通显示屏所能呈现的显示效果。可能还有小伙伴没看现场的视频,可以看一下:

https://www.zhihu.com/video/1473958962386739200

明明这是一个显示技术,官方的名称为什么叫“阿里云聚”呢?其实这是因为,之所以能取得如此惊艳的效果,最重要的核心技术不仅仅是我们看得见的面前的这款显示屏本身,还包括我们看不到的、尤其是云端的大量黑科技。

要能够实现我们看到的这么棒的发布会效果,至少有三个方面的“黑科技”:

(1)拍摄与显示的硬件设备

从现场的情况来看,发布会现场的“全息显示仓”是一块一人多高的高清大屏幕,用于显示参加新闻发布会的两位嘉宾的实时影像,仿佛两个人都同时站在大家面前。

从官方透露的消息来看,拍摄端的硬件布置大概是这样的:

拍摄端在摄影棚内,有常规的灯光、交互提示用的电视屏。除此之外,还有一块不太常规的屏幕,那就是用于显示另外一个人的“显示仓”。而且这个显示仓的位置和角度是特意设计过的,使得望向屏幕中的人时,拍摄出来的视线恰好符合两人站在一起时的视线。如此一来,物品的交接才会显得如此自然。

(2)符合广播级稳定要求的实时通信网络

很多小伙伴可能会觉得,本质上这不就是个复杂一些的视频会议嘛,只不过级别更高、屏幕更大、清晰度更高、稳定性要求更高。非要这么说倒也没错,但是要注意的是,无论是什么技术,随着从量变到质变的过程,要解决的技术问题的数量和难度可都是非线性陡增的。要想实现类似高规格发布会的万无一失,网络传输环节要实现的保障度是远远超出大多数时候的。

比如为了能够实现发丝级的“全息复刻”,拍摄的原始画面清晰度是非常高的,如果按照传统方式传输,将挤占大量带宽,极有可能遇到网络拥堵问题。阿里云聚这次采用了一种叫作“窄带高清”的技术,能够在节省50%带宽的情况下,仍然保障画面的清晰度。

另外,即便我们使用的是运营商最高带宽的宽带套餐,日常生活中还是难免会遇到网络信号不好的情况,造成视频会议时的画面卡顿。平时会议稍微等一等倒也问题不大,但是对新闻发布会这种高级别会议,卡顿显然是无法接受的。为了能够在网络信号不好的情况下依然保持画面流程,阿里云聚开发了“弱网抗丢包”技术,能够在80% 丢包下可提供流畅通话,同等丢包环境弱网传输效率提升65%,实现良好的实施传输效果。

(3)强大的云端算法与算力

不知道大家有没有注意到,记者会现场的全息显示仓中,张勇与巴赫所处的似乎是一个封闭的空间,两个人的身后似乎有一定的纵深,墙上也有很自然的阴影效果,使得图像出现了较强的空间感。其实这种光影效果是计算机实时渲染出来的,起到了以假乱真的效果。这是需要强大的算法与计算力的。

其实需要算法与算力的远不止视频的实时渲染。比如音频的处理,我们都有过在嘈杂环境下开会的经历,要想听清对方讲话是非常困难的。阿里云聚通过亿次通话数据验证和海量历史数据回归,实现了持续进步的多场景智能降噪能力。而这同样需要算法与算力的加持。

根据研究,要想实现流畅舒适的交互效果,延时必须控制在200ms以内。

也就是说,端到端的实时传输和处理,比如音视频转码、光影渲染、音频智能降噪等等功能,都需要在200ms以内实现,这需要高效的算法与强大的算力,靠拍摄或发布会现场的端侧计算机是无法做到的。阿里云聚解决这个问题的方法是“云处理+端渲染”技术,即通过实时通信与云上处理的技术结合,解决因端侧算力受限的难题。

其实可以看得出,这次的高级别新闻发布会算是阿里云聚的一次“亮剑”:连如此高要求的场景都能hold住,其他的应用场景更不在话下。很明显,这种“宛若就在面前”的显示与交互技术,还可以应用在很多其他的应用场合,比如远程教育、虚拟社交、远程VR操控等等。而在新冠疫情的大背景下,甚至只用它来开个远程视频会,都让会议显得更温暖了呢……




  

相关话题

  有哪一瞬间让你很佩服一个人的生活智慧? 
  为什么机器学习解决网络安全问题总是失败? 
  有哪些拙劣但成功过的骗局? 
  我对谷爱凌喜欢不起来,真的是我有问题吗? 
  你拍过哪些好看的猫咪照片? 
  如何看待陈铭《立场》采访中家长「没游戏就没这个问题了」的观点,没了游戏世界会更好吗? 
  上海迪士尼玩偶开售当天凌晨 3 点有超 5000 人在排队购买,凌晨排队抢购玩偶的人是什么心理? 
  为什么有很多从农村出来的人,在城市立足之后就特别厌恶农村人觉得农村人都都特别愚昧,好像有一种优越感? 
  大学四月中旬前能开学吗? 
  应该用怎样的态度看待邀请名人答题却被忽略的情况? 

前一个讨论
你觉得这辈子有希望看到996消失吗?
下一个讨论
成长型企业如何灵活、高效、全方位地实现数字化转型?





© 2024-12-22 - tinynew.org. All Rights Reserved.
© 2024-12-22 - tinynew.org. 保留所有权利