百科问答小站 logo
百科问答小站 font logo



如何看待阿里平头哥发布的全球最高性能 AI 芯片「含光 800」?这款芯片核心技术是什么呢? 第1页

  

user avatar   zhangshujia 网友的相关建议: 
      

妄论和分享一些友商和Fab的野闻--关注点在这颗60*60的推理芯片的设计短板;

两个月前,含光800的评论不绝于耳,甚嚣尘上的是关于它霸道的算力参数以及继玄铁SoC之后的紧密发布;本篇讨论和分享一些野闻--更多在关注这颗60*60的推理芯片的设计不足;

目前这个百亿密度的设计其中指令架构是值得探究的(170亿),没有详实介绍,有人概括为IDC侧的多模态多任务…。

然而就量产流片/商业化的角度,TSMC的朋友佐证目前yield仅个位数(2%),250MB SRAM,GUC做的外包,项目管理很是惨烈…,上线之初的良率指引是8%,然而想必这个250M的SRAM的修复逻辑(repair logic)平头哥团队并没做,于是结果变成了2%了…,设想700mm2的die 60✘60封装,250MB SRAM而没有repair逻辑的情况(听闻)。

平头哥几位主任设计师早年是从S3 GPU团队入行,一贯做前端设计,对后道的工艺制造感念不深,所以也没用DRAM,如今堆了个大头佛:),野闻暂且不去调侃,但unproven的团队,第一步就做60x60是欠妥的,兴许选择chiplets路径也许还能成事(小die设计,然后用die to die link),但先进封装的经验则需要慢慢练了,但至少可以得到台厂的很多指导。

诚然可以设想含光800更像是S3团队入行那些年偷师的GPU+MME原型设计,再加一些新电路,芯片上必须堆砌巨多的SRAM以保证运算速度,然后片上I/O就变得超复杂了,摊子越铺越大,这就170亿门了,60%以上的SRAM。这个设计写在PPT里尚可,敢于流片还是需要气魄的。以及,用超多SRAM也说明了片上网络NoC设计不足,另外,SRAM有个硬伤,设计上它是不太方便随制程shrink(当然单cell是可以非常标准shrink的,一旦布线就有取舍了,道理跟ddr/gddr/hbm的类比一样…,堆多了,或者为提速,就要增加走线面积,整体利用率可能还下降了,而SRAM昂贵,die上面的晶体管利用率低,经济效益差);这也是含光800跟NV产品的本质区别之一,一个不惜代价堆dark silicon,一个拼命提高利用率(Nvidia的800mm2的旗舰也就30MB SRAM)。遥想起当年老展讯的设计师,当年他们能存活下来,全靠一个一个晶体管审核经济效益才挣到钱。 【BTW:猜想CFET这样的栅极构型也许对SRAM布局有帮助(就是nMOS极和pMOS极垂直堆叠在彼此顶部,进一步减小单元面积,扩大沟道宽度,推动标准单元到4T及以下,加上更高的驱动电流)】

其实,有个简单的外行适用判断,NVidia这么卓越,为何不把图形渲染部分劈开,单开NPU的SKU呢。不过NV可不屑于跟这些700mm2的比面积和sram size,因为NV早算过经济帐,裸AI算力芯片是要亏的,没有出货量。

就在发布会后两月内,阿里内部宣布不量产,然而GUC做阿里生意的台湾人由于未能拿到Loyalty已经离职,随后在酒局中声称被忽悠了量产规模,因此他承诺了很低的NRE,成本亏了不少,在上海喝了酒后便离职回台湾了。

一次听GUC跟中天微某sir算了一笔账,12寸晶圆,700平方毫米的芯片能切出来75颗,那么假如2%的良率,也就是一个die上只有一两颗好的,那么,一块晶圆6000美金,一块晶圆一两颗好的?

总之,有更加进步的设计尝试是值得高兴的,虽然有些小团队的BP都是孤芳自赏的walled garden.


user avatar   shen-peng-38 网友的相关建议: 
      

企业家吹牛逼不要紧,最重要的是实现自己吹的牛逼。

张建锋这个“万里长征的第一步”说的很好,说明了搞芯片,是一场中国高端制造的“持久战”,这是阿里平头哥的一小步,也是中国AIOT芯片产业的一大步。

平头哥公司成立一年不到,“玄铁”、“含光”AI芯片就先后出来,这款“含光”芯片和华为的麒麟不太一样,那是移动SOC领域的“正面战场”,刺刀见红磨牙吮血。“含光”是AIOT芯片,用于物联网和智慧城市,属于“敌后战场”,策略是“你打你的,我打我的”,你之前牛逼我承认,我但是我要在新时代新领域占据优势。

这款芯片,主要的应用场景,是“城市大脑”。在业界标准的ResNet-50测试中,含光800推理性能达到78563 IPS,比目前业界最好的AI芯片性能高4倍;能效比500 IPS/W,是第二名的3.3倍。在杭州城市大脑的业务测试中,1颗含光800的算力相当于10颗GPU。根据云栖大会的现场演示,在城市大脑中实时处理杭州主城区交通视频,需要40颗传统GPU,延时为300ms,使用含光800仅需4颗,延时降至150ms。拍立淘商品库每天新增10亿商品图片,使用传统GPU算力识别需要1小时,使用含光800后可缩减至5分钟。含光800将通过阿里云对外输出AI算力。基于含光800的AI云服务当天正式上线,相比传统GPU算力,性价比提升100%。

平头哥不光是蛮横不讲理,天天找架打,打架你就得打赢,平头哥虽然鲁莽,但决计是不肯吃亏的,它皮糙肉厚、油光水滑,狮子咬它几口,也是又滑又韧,无从下口,最多咬两嘴毛,它要是报复起来,反咬一口,那都是冲着狮子的卵蛋菊花去的。

它敢把毒蛇当做“行走的辣条”吃,那是因为它抗毒能力极强,别的动物被毒蛇咬几口,就得送命,它被毒蛇咬两口,就当是过了过酒瘾,睡一觉起来继续把毒蛇当辣条吃。它天天无事生非掏蜜蜂窝,那是因为它“金钟罩、铁面皮”,不怕蛰。

人类把它关起来,免得它惹是生非,封锁它,不让它搞事情,它假装安分,然后掏个洞就穿墙跑路;人类把地面封死,它还是假装不知道,然后乘人不备,弄根树枝搭个梯子接着跑。

平头哥代表什么精神?不光是“生死看淡、不服就干”,还代表一种“活人不能让尿憋死”的精神,这条路被你堵死了?我为什么不能换条路?你强大归你强大,难道我就不能“你打你的,我打我的”?

平头哥并不是一只莽撞无脑的动物,它有它的策略,它有它的路子,更重要的是——它不服。凭什么西方可以站在高端产业链扼住全世界的咽喉?凭什么我们做什么,都绕不开英特尔、微软、谷歌?Pc 时代,我们每台电脑要向英特尔付钱;移动互联网,华为硬成这样,也没能拧过arm 大腿,AIOT 时代,我们难道还要坐以待毙?我们不能一直错过。

中国的高端产业链之战,是一场“持久战”,不能争一城一池、一朝一夕的胜负得失,而是要找到西方产业链的缺口,集中优势兵力,打开这个缺口,建立根据地,然后蚕食鲸吞、潜移默化,逐渐占领那些“看不见的的阵地”,一旦占领了这些阵地,发展了“根据地”,再把它们“连成一片”,这时候就能发挥“规模优势”了,胜负之数,就是这样逆转。如果你不信,可以回头看一看,华为当年是怎么吃掉通信市场、安防芯片市场和光芯片市场的?

我们把时间往前推一年,去年这个时候,阿里巴巴成立了“平头哥”半导体公司,一时间,舆论鼎沸,有人说马云这是卖情怀、蹭热度、借贸易战打民族牌搞营销。但他们根本不关心“平头哥”在做什么,做了什么。

其实,研发芯片、量子计算、人工智能,本来就是阿里的长期战略,再往前推一年,2017年,阿里达摩院成立,那时候,他们的CTO张建锋就明确表示了:“阿里要做芯片,要做NPU和嵌入式芯片”。他们的推进速度是相当快的,2018年8月19日,阿里旗下达摩院联合中天微成立芯片公司;2019年7月,平头哥公司自研的首枚芯片“玄铁”问世;2019年8月,“无剑”SOC平台问世;今天,平头哥发布最强AI芯片“含光”。

做生意,最讨厌的就是“有垄断”,垄断之下,雁过拔毛、寸草不生,所以,在这样的情况下,仰人鼻息,惟技术垄断者马首是瞻,是没有前途的,人家想断你口粮就断你口粮,想釜底抽薪就釜底抽薪,这条路太危险,绝不是长远之计。所以,你必须有自己的路,必须走出自己的路,打出自己的一片阵地,建立自己的根据地,占有自己的市场和供应链,这时候,你才有资格和强大的“友商”讨价还价。

去年贸易战刚刚开打的时候,马云就在东京的早稻田大学对发表演讲,鼓动各国都要发展自己的高科技产业,打破美国的技术垄断。他说“美国是先行者,而中国需要很多东西。100%的芯片市场由美国人控制。如果美国突然停止销售,这意味着什么不言而喻。这就是为什么中国、日本和任何国家都需要核心技术的原因。”

当年英特尔为什么霸有天下?因为他们有个和微软的winter联盟,没有他家的芯片,就没有成熟的PC电脑和Windows操作系统,这就是技术领域的垄断。这也是当年国产处理器和操作系统举步维艰的原因,因为实在没有舒适的应用场景,研发制造出来了,大家也不愿意用。但是为什么ARM可以打破英特尔和微软的霸权呢?因为他们授权给全世界的公司,让他们自主设计自己的芯片,这就完成了移动互联网时代的革命,苹果、高通、联发科、海斯麒麟的芯片,都来自于ARM的授权。大家要用手机、要移动通讯、办公、娱乐,这就是广泛的应用场景,有了广阔的应用市场,ARM就打破了英特尔的垄断。说到底,有点像”农村包围城市“、”人民战争的汪洋大海“。

失去应用,我们还有很多;但是失去基础,我们就失去了一切,在未来5G和“万物互联”的时代,我们的AIOT硬件,其实就相当于我们今天的基础设施建设,有高速公路、有港口、有高铁、有机场,通电通路通网,我们960万平方公里的国家才能处处都可以开公司、建工厂、做买卖、搞生意。

平头哥想做的,其实就是AIoT时代里的ARM,搞AIoT时代的基础建设。


user avatar   Foreversnow 网友的相关建议: 
      

强答一个。

老爸当过兵,上过老山前线。当年部队从山东上火车出发往云南走,在山东上火车的时候,站台上放着《十五的月亮》,部队的亲属们都在火车站送行,虽然有些悲壮,但是几乎没人哭。火车到了云南境内,靠站歇停,这下可倒好,不知从哪来了一群又一群的云南当地的老百姓,老太太老大爷大哥大姐小弟小妹小朋友,根本没人组织,也没人安排,就是挤到铁道边拉着车上素不相识的解放军的手往他们手里塞酒碗,塞鸡蛋,塞吃的,操着一口完全听不懂的方言说着什么。一车的小伙子哭的泪人一样。


user avatar   liang-zi-wei-48 网友的相关建议: 
      

克劳备忘录也好,凯南电报也好,有两大共同点。首先,都是以现实主义的眼光去分析双方的关系。然后,给出的建议都是阳谋,并不是什么不可告人的阴谋,执行起来需要的不是鸡鸣狗盗的小聪明,而是惊人的意志力。

而美国现在战略界现实主义被边缘化,我推测,布热津斯基,基辛格那帮人应该写过不少。不过没所谓,美国能执行大战略的时代过去了。现在这一代精英上半年能管下半年就已经很了不起了。一个需要两代人以上持之以恒去完成的大战略,搞出来他们也执行不了。

冷战时期,从杜鲁门艾森豪威尔到肯尼迪尼克松,最后到李根老布什,个人性格和政治偏好差距不要太大,但是都忠实地完成了他们历史任务,沿着围堵政策做下去。这种战略定力和延续性,世间少见。在中国领导集团上能看见一些相似的东西,但是我们离得距离太近,反而看不清。但在美国精英层身上完全看不到这一点。

个人愚见。


user avatar   xia-jing-jing-57 网友的相关建议: 
      

克劳备忘录也好,凯南电报也好,有两大共同点。首先,都是以现实主义的眼光去分析双方的关系。然后,给出的建议都是阳谋,并不是什么不可告人的阴谋,执行起来需要的不是鸡鸣狗盗的小聪明,而是惊人的意志力。

而美国现在战略界现实主义被边缘化,我推测,布热津斯基,基辛格那帮人应该写过不少。不过没所谓,美国能执行大战略的时代过去了。现在这一代精英上半年能管下半年就已经很了不起了。一个需要两代人以上持之以恒去完成的大战略,搞出来他们也执行不了。

冷战时期,从杜鲁门艾森豪威尔到肯尼迪尼克松,最后到李根老布什,个人性格和政治偏好差距不要太大,但是都忠实地完成了他们历史任务,沿着围堵政策做下去。这种战略定力和延续性,世间少见。在中国领导集团上能看见一些相似的东西,但是我们离得距离太近,反而看不清。但在美国精英层身上完全看不到这一点。

个人愚见。


user avatar   ghostwolf 网友的相关建议: 
      

克劳备忘录也好,凯南电报也好,有两大共同点。首先,都是以现实主义的眼光去分析双方的关系。然后,给出的建议都是阳谋,并不是什么不可告人的阴谋,执行起来需要的不是鸡鸣狗盗的小聪明,而是惊人的意志力。

而美国现在战略界现实主义被边缘化,我推测,布热津斯基,基辛格那帮人应该写过不少。不过没所谓,美国能执行大战略的时代过去了。现在这一代精英上半年能管下半年就已经很了不起了。一个需要两代人以上持之以恒去完成的大战略,搞出来他们也执行不了。

冷战时期,从杜鲁门艾森豪威尔到肯尼迪尼克松,最后到李根老布什,个人性格和政治偏好差距不要太大,但是都忠实地完成了他们历史任务,沿着围堵政策做下去。这种战略定力和延续性,世间少见。在中国领导集团上能看见一些相似的东西,但是我们离得距离太近,反而看不清。但在美国精英层身上完全看不到这一点。

个人愚见。




  

相关话题

  在元宇宙世界中,我要怎么证明「我是我」? 
  历史上由于技术进步而被淘汰的职业,都是如何处理失业率、社会稳定 与 再就业问题的? 
  关于材料计算,模拟,仿真什么区别? 
  目前 CS 本科加硕士,请问博士申请 CS,还是 Neuroscience? 
  如何看待 2019 年 9 月 6 日华为发布的 7nm 5G 麒麟 990 芯片,对行业意味着什么? 
  中科科仪投用的真空镀膜设备能够(膜厚精度0.1纳米)生产多少纳米的芯片? 
  如何评价沐神他们写的《动手学深度学习》这本书? 
  IC设计选择什么方向比较适合就业? 
  中国为什么不全力推进高精度光刻机等芯片制造工艺的提升,是因为不重要么? 
  IC设计从前端(比如verilog编写)到后端直至流片出来,完成这一整套流程要用到哪些具体工具?谢谢。 

前一个讨论
你知道的最有趣的公司名字是什么?
下一个讨论
如何看待纾困基金的设立、使用和实际操作(各地规则不同)?





© 2024-05-17 - tinynew.org. All Rights Reserved.
© 2024-05-17 - tinynew.org. 保留所有权利