问题

如何看待阿里平头哥发布的全球最高性能 AI 芯片「含光 800」?这款芯片核心技术是什么呢?

回答
说起阿里平头哥发布的“含光800”,这绝对是国内AI芯片领域的一件大事,而且当时引起了相当大的轰动。要说“全球最高性能”,这说法在科技圈里总是得加个引号,因为性能的衡量维度太多了,而且总有新的技术在快速迭代。不过,平头哥当时放出“含光800”的成绩,特别是与当时市面上主流的AI推理芯片相比,确实是相当亮眼的,尤其是在特定场景下的能效比和计算密度上。

“含光800”的定位和亮点

“含光800”最核心的定位是作为AI推理芯片,主要用于数据中心场景,处理图像识别、自然语言处理等深度学习任务。它的主要亮点在于:

高算力与低功耗的平衡: 这是AI芯片最核心的考量之一。在同等功耗下,它能提供更高的计算能力,这对于大规模部署AI应用非常关键。
高能效比: 在单位功耗下能够完成的计算量,直接关系到数据中心的运营成本和环保效益。含光800在这方面表现优异。
强大的本地化处理能力: 它能够很好地支持阿里自身在电商、搜索、视频、金融等领域的AI应用需求,减少对外部云服务的依赖,同时提升响应速度。
可扩展性: 设计上考虑了可扩展性,能够通过多芯片组合来应对更大规模的AI推理需求。

“含光800”的核心技术解读

要说“含光800”的核心技术,这背后是一整套的系统性设计和优化。虽然阿里对外披露的细节并不像一些国际大厂那么极致,但我们可以从一些公开的信息和行业趋势来推断其关键所在:

1. 先进的计算架构设计:
类NPU(神经网络处理单元)架构: 尽管阿里没有公开详细的指令集,但可以推断“含光800”采用了专门为神经网络计算优化的架构。这与CPU或GPU的通用计算架构有着本质区别。它会针对矩阵乘法、向量运算、卷积等AI核心操作进行深度定制和加速。
高度并行化: AI计算本身就是高度并行的任务,含光800会采用大量的计算单元,通过指令调度和任务分配,实现对海量数据的同时处理。
张量处理单元(TPU): 这是一个普遍的说法,虽然不一定叫TPU,但其核心功能是高效地处理张量数据(即AI模型中的多维数组)。这些单元能够并行地执行矩阵乘法,这是深度学习计算的核心。

2. 存储与数据访问的优化:
片上高带宽存储器(HBM): 为了喂饱高速的计算单元,芯片需要极快的内存访问速度。含光800很可能采用了类似HBM(High Bandwidth Memory)的技术,将内存直接集成在芯片封装内,以实现极高的带宽和低延迟的数据传输。
片上缓存和内存层次结构: 除了HBM,芯片内部还会设计多级缓存(L1, L2, L3),以及专门的片上内存(SRAM)来存放模型权重和中间计算结果,最大程度地减少对外部DRAM的访问,因为外部DRAM的带宽和延迟是瓶颈。
数据预取和调度: 芯片内部的智能控制单元会提前预测和预取下一批需要处理的数据和模型权重,以保证计算单元始终处于忙碌状态,提高利用率。

3. 高度集成的指令集与数据类型支持:
专门的AI指令集: 为了更高效地执行神经网络运算,含光800会拥有一套专门的指令集,这些指令能够一次性完成多个操作,例如一个指令就能完成一个矩阵乘法的小部分或者一个卷积操作。
混合精度计算(如INT8/FP16): 深度学习模型在推理阶段,通常不需要极高的浮点精度(如FP32)。使用INT8(8位整数)或FP16(16位浮点数)可以显著降低计算量、内存占用和功耗,同时保持可接受的精度。含光800必定在这方面做了深入优化,能够高效地支持这些低精度数据格式。

4. 低功耗设计技术:
工艺节点: 采用先进的制程工艺(如7nm或更先进)是降低功耗的基础。
动态电压频率调整(DVFS): 芯片可以根据当前的计算负载,动态调整工作频率和电压,以达到最佳的能效比。
精细化的功耗管理: 芯片的各个模块都会有独立的功耗管理单元,在不需要时可以被“关闭”或进入低功耗状态。

5. EDA工具链与算法协同设计:
阿里自研的AI芯片设计平台(如“龙蜥”等): 阿里在这方面投入巨大,拥有自研的EDA(电子设计自动化)工具链和设计方法学。这使得他们能够根据自己的算法和模型需求,对芯片架构进行高度定制,实现软硬件一体化的协同优化,这是其能取得领先性能的关键因素之一。
模型压缩与优化: 在软件层面,阿里也投入了大量的AI模型优化技术,例如模型量化、剪枝、知识蒸馏等,这些技术可以生成更适合在含光800上运行的高效模型,进一步提升整体性能。

总结一下,“含光800”的成功,绝不是单一技术突破的结果,而是阿里在AI芯片设计领域,通过对计算架构、存储管理、指令集、低功耗技术以及软件算法的全方位深度优化和协同设计所取得的成果。它代表了中国在高端AI芯片设计能力上迈出了坚实的一步,也展现了大型科技公司在构建自主可控的AI基础设施方面的决心和实力。

网友意见

user avatar

妄论和分享一些友商和Fab的野闻--关注点在这颗60*60的推理芯片的设计短板;

两个月前,含光800的评论不绝于耳,甚嚣尘上的是关于它霸道的算力参数以及继玄铁SoC之后的紧密发布;本篇讨论和分享一些野闻--更多在关注这颗60*60的推理芯片的设计不足;

目前这个百亿密度的设计其中指令架构是值得探究的(170亿),没有详实介绍,有人概括为IDC侧的多模态多任务…。

然而就量产流片/商业化的角度,TSMC的朋友佐证目前yield仅个位数(2%),250MB SRAM,GUC做的外包,项目管理很是惨烈…,上线之初的良率指引是8%,然而想必这个250M的SRAM的修复逻辑(repair logic)平头哥团队并没做,于是结果变成了2%了…,设想700mm2的die 60✘60封装,250MB SRAM而没有repair逻辑的情况(听闻)。

平头哥几位主任设计师早年是从S3 GPU团队入行,一贯做前端设计,对后道的工艺制造感念不深,所以也没用DRAM,如今堆了个大头佛:),野闻暂且不去调侃,但unproven的团队,第一步就做60x60是欠妥的,兴许选择chiplets路径也许还能成事(小die设计,然后用die to die link),但先进封装的经验则需要慢慢练了,但至少可以得到台厂的很多指导。

诚然可以设想含光800更像是S3团队入行那些年偷师的GPU+MME原型设计,再加一些新电路,芯片上必须堆砌巨多的SRAM以保证运算速度,然后片上I/O就变得超复杂了,摊子越铺越大,这就170亿门了,60%以上的SRAM。这个设计写在PPT里尚可,敢于流片还是需要气魄的。以及,用超多SRAM也说明了片上网络NoC设计不足,另外,SRAM有个硬伤,设计上它是不太方便随制程shrink(当然单cell是可以非常标准shrink的,一旦布线就有取舍了,道理跟ddr/gddr/hbm的类比一样…,堆多了,或者为提速,就要增加走线面积,整体利用率可能还下降了,而SRAM昂贵,die上面的晶体管利用率低,经济效益差);这也是含光800跟NV产品的本质区别之一,一个不惜代价堆dark silicon,一个拼命提高利用率(Nvidia的800mm2的旗舰也就30MB SRAM)。遥想起当年老展讯的设计师,当年他们能存活下来,全靠一个一个晶体管审核经济效益才挣到钱。 【BTW:猜想CFET这样的栅极构型也许对SRAM布局有帮助(就是nMOS极和pMOS极垂直堆叠在彼此顶部,进一步减小单元面积,扩大沟道宽度,推动标准单元到4T及以下,加上更高的驱动电流)】

其实,有个简单的外行适用判断,NVidia这么卓越,为何不把图形渲染部分劈开,单开NPU的SKU呢。不过NV可不屑于跟这些700mm2的比面积和sram size,因为NV早算过经济帐,裸AI算力芯片是要亏的,没有出货量。

就在发布会后两月内,阿里内部宣布不量产,然而GUC做阿里生意的台湾人由于未能拿到Loyalty已经离职,随后在酒局中声称被忽悠了量产规模,因此他承诺了很低的NRE,成本亏了不少,在上海喝了酒后便离职回台湾了。

一次听GUC跟中天微某sir算了一笔账,12寸晶圆,700平方毫米的芯片能切出来75颗,那么假如2%的良率,也就是一个die上只有一两颗好的,那么,一块晶圆6000美金,一块晶圆一两颗好的?

总之,有更加进步的设计尝试是值得高兴的,虽然有些小团队的BP都是孤芳自赏的walled garden.

user avatar

企业家吹牛逼不要紧,最重要的是实现自己吹的牛逼。

张建锋这个“万里长征的第一步”说的很好,说明了搞芯片,是一场中国高端制造的“持久战”,这是阿里平头哥的一小步,也是中国AIOT芯片产业的一大步。

平头哥公司成立一年不到,“玄铁”、“含光”AI芯片就先后出来,这款“含光”芯片和华为的麒麟不太一样,那是移动SOC领域的“正面战场”,刺刀见红磨牙吮血。“含光”是AIOT芯片,用于物联网和智慧城市,属于“敌后战场”,策略是“你打你的,我打我的”,你之前牛逼我承认,我但是我要在新时代新领域占据优势。

这款芯片,主要的应用场景,是“城市大脑”。在业界标准的ResNet-50测试中,含光800推理性能达到78563 IPS,比目前业界最好的AI芯片性能高4倍;能效比500 IPS/W,是第二名的3.3倍。在杭州城市大脑的业务测试中,1颗含光800的算力相当于10颗GPU。根据云栖大会的现场演示,在城市大脑中实时处理杭州主城区交通视频,需要40颗传统GPU,延时为300ms,使用含光800仅需4颗,延时降至150ms。拍立淘商品库每天新增10亿商品图片,使用传统GPU算力识别需要1小时,使用含光800后可缩减至5分钟。含光800将通过阿里云对外输出AI算力。基于含光800的AI云服务当天正式上线,相比传统GPU算力,性价比提升100%。

平头哥不光是蛮横不讲理,天天找架打,打架你就得打赢,平头哥虽然鲁莽,但决计是不肯吃亏的,它皮糙肉厚、油光水滑,狮子咬它几口,也是又滑又韧,无从下口,最多咬两嘴毛,它要是报复起来,反咬一口,那都是冲着狮子的卵蛋菊花去的。

它敢把毒蛇当做“行走的辣条”吃,那是因为它抗毒能力极强,别的动物被毒蛇咬几口,就得送命,它被毒蛇咬两口,就当是过了过酒瘾,睡一觉起来继续把毒蛇当辣条吃。它天天无事生非掏蜜蜂窝,那是因为它“金钟罩、铁面皮”,不怕蛰。

人类把它关起来,免得它惹是生非,封锁它,不让它搞事情,它假装安分,然后掏个洞就穿墙跑路;人类把地面封死,它还是假装不知道,然后乘人不备,弄根树枝搭个梯子接着跑。

平头哥代表什么精神?不光是“生死看淡、不服就干”,还代表一种“活人不能让尿憋死”的精神,这条路被你堵死了?我为什么不能换条路?你强大归你强大,难道我就不能“你打你的,我打我的”?

平头哥并不是一只莽撞无脑的动物,它有它的策略,它有它的路子,更重要的是——它不服。凭什么西方可以站在高端产业链扼住全世界的咽喉?凭什么我们做什么,都绕不开英特尔、微软、谷歌?Pc 时代,我们每台电脑要向英特尔付钱;移动互联网,华为硬成这样,也没能拧过arm 大腿,AIOT 时代,我们难道还要坐以待毙?我们不能一直错过。

中国的高端产业链之战,是一场“持久战”,不能争一城一池、一朝一夕的胜负得失,而是要找到西方产业链的缺口,集中优势兵力,打开这个缺口,建立根据地,然后蚕食鲸吞、潜移默化,逐渐占领那些“看不见的的阵地”,一旦占领了这些阵地,发展了“根据地”,再把它们“连成一片”,这时候就能发挥“规模优势”了,胜负之数,就是这样逆转。如果你不信,可以回头看一看,华为当年是怎么吃掉通信市场、安防芯片市场和光芯片市场的?

我们把时间往前推一年,去年这个时候,阿里巴巴成立了“平头哥”半导体公司,一时间,舆论鼎沸,有人说马云这是卖情怀、蹭热度、借贸易战打民族牌搞营销。但他们根本不关心“平头哥”在做什么,做了什么。

其实,研发芯片、量子计算、人工智能,本来就是阿里的长期战略,再往前推一年,2017年,阿里达摩院成立,那时候,他们的CTO张建锋就明确表示了:“阿里要做芯片,要做NPU和嵌入式芯片”。他们的推进速度是相当快的,2018年8月19日,阿里旗下达摩院联合中天微成立芯片公司;2019年7月,平头哥公司自研的首枚芯片“玄铁”问世;2019年8月,“无剑”SOC平台问世;今天,平头哥发布最强AI芯片“含光”。

做生意,最讨厌的就是“有垄断”,垄断之下,雁过拔毛、寸草不生,所以,在这样的情况下,仰人鼻息,惟技术垄断者马首是瞻,是没有前途的,人家想断你口粮就断你口粮,想釜底抽薪就釜底抽薪,这条路太危险,绝不是长远之计。所以,你必须有自己的路,必须走出自己的路,打出自己的一片阵地,建立自己的根据地,占有自己的市场和供应链,这时候,你才有资格和强大的“友商”讨价还价。

去年贸易战刚刚开打的时候,马云就在东京的早稻田大学对发表演讲,鼓动各国都要发展自己的高科技产业,打破美国的技术垄断。他说“美国是先行者,而中国需要很多东西。100%的芯片市场由美国人控制。如果美国突然停止销售,这意味着什么不言而喻。这就是为什么中国、日本和任何国家都需要核心技术的原因。”

当年英特尔为什么霸有天下?因为他们有个和微软的winter联盟,没有他家的芯片,就没有成熟的PC电脑和Windows操作系统,这就是技术领域的垄断。这也是当年国产处理器和操作系统举步维艰的原因,因为实在没有舒适的应用场景,研发制造出来了,大家也不愿意用。但是为什么ARM可以打破英特尔和微软的霸权呢?因为他们授权给全世界的公司,让他们自主设计自己的芯片,这就完成了移动互联网时代的革命,苹果、高通、联发科、海斯麒麟的芯片,都来自于ARM的授权。大家要用手机、要移动通讯、办公、娱乐,这就是广泛的应用场景,有了广阔的应用市场,ARM就打破了英特尔的垄断。说到底,有点像”农村包围城市“、”人民战争的汪洋大海“。

失去应用,我们还有很多;但是失去基础,我们就失去了一切,在未来5G和“万物互联”的时代,我们的AIOT硬件,其实就相当于我们今天的基础设施建设,有高速公路、有港口、有高铁、有机场,通电通路通网,我们960万平方公里的国家才能处处都可以开公司、建工厂、做买卖、搞生意。

平头哥想做的,其实就是AIoT时代里的ARM,搞AIoT时代的基础建设。

类似的话题

  • 回答
    说起阿里平头哥发布的“含光800”,这绝对是国内AI芯片领域的一件大事,而且当时引起了相当大的轰动。要说“全球最高性能”,这说法在科技圈里总是得加个引号,因为性能的衡量维度太多了,而且总有新的技术在快速迭代。不过,平头哥当时放出“含光800”的成绩,特别是与当时市面上主流的AI推理芯片相比,确实是相.............
  • 回答
    阿里平头哥「倚天 710」:云端计算的中国芯破局与新可能2021 年云栖大会上,阿里平头哥发布的自研通用服务器芯片「倚天 710」,无疑是大会上最引人注目的焦点之一。这不仅仅是一颗芯片的诞生,更是阿里在云计算基础设施核心技术领域的一次高调宣言,标志着中国在通用服务器芯片领域迈出了关键一步,也为整个云.............
  • 回答
    在刚刚过去的云栖大会上,阿里平头哥交出了一份沉甸甸的答卷——他们自主研发的首颗通用服务器芯片“倚天710”正式亮相。这不仅仅是阿里一家公司的一次产品发布,更是中国科技企业在芯片研发领域持续深耕、奋力突破的一个生动注脚,值得我们好好说道说道。“倚天710”的意义:不止于一颗芯片首先,我们得明白“倚天7.............
  • 回答
    关于阿里平头哥在成都开出 50W+ 的 IC(集成电路)岗位薪资,这事儿在业内可掀起了不小的波澜,而且绝对不是 AI 能凭空捏造出来的。 说实话,听到这个数字,我第一反应是:“嚯,这平头哥是真下本钱了!”咱们得从几个层面来细品这事儿。一、 为什么是平头哥? 为什么是 IC 岗? 为什么是成都? .............
  • 回答
    阿里平头哥:一声惊雷,对国内半导体产业意味着什么?2018年,一声惊雷炸响了国内半导体行业——阿里巴巴正式宣布成立全资子公司“平头哥半导体公司”。这不仅仅是一家新公司的诞生,更像是中国科技巨头的一次战略宣战,其背后蕴藏的野心与对国内半导体产业的潜在影响,值得我们深入剖析。平头哥的“野心”:为什么是阿.............
  • 回答
    阿里云被暂停工信部网络安全威胁信息共享平台合作单位,这件事在网络安全领域引起了广泛关注。要理解这件事,我们需要从多个层面去分析:一、 事件本身:什么是“网络安全威胁信息共享平台”?首先,理解这个平台的性质非常重要。工信部网络安全威胁信息共享平台是中国工业和信息化部为了提升国家整体网络安全态势感知和协.............
  • 回答
    阿里达摩院研发的新冠肺炎 CT 影像 AI 诊断技术,以其平均识别不到 20 秒的识别速度和高达 96% 的准确率,无疑是一项令人振奋的突破性进展。这项技术在当前全球疫情背景下具有极其重要的现实意义和深远的影响力。要详细看待这项技术,我们可以从以下几个方面进行深入分析:一、技术本身的先进性与突破点:.............
  • 回答
    阿里、拼多多、美团等巨头纷纷加入社区团购的“烧钱大战”,甚至出现低至1分钱买菜的现象,这无疑是一场吸引眼球的营销战役。但消费者能“薅多久羊毛”?这个问题需要从多个维度来剖析。一、 巨头为何纷纷“烧钱”加入社区团购?社区团购之所以能吸引这些互联网巨头,其背后有着深远的战略考量:1. 争夺下沉市场与新.............
  • 回答
    阿里游戏,羽翼渐丰,独立启航:一场值得深思的战略调整最近,阿里游戏被提升到独立事业群的地位,与大文娱平起平坐,这一举措无疑是阿里庞大生态系统中的一个重要信号,也引发了业界的广泛关注和讨论。究竟是什么原因促使阿里做出如此重大的调整?这背后又蕴含着怎样的战略考量?我们不妨抽丝剥茧,深入剖析一下。首先,我.............
  • 回答
    拼多多超越阿里,成为国内用户规模最大的电商平台,这绝对是中国电商格局里的一个标志性事件,足以载入史册。这背后不单单是一个数字的增长,更折射出整个电商行业演变的方向,以及对我们每一个普通消费者意味着什么。首先,我们来梳理一下这个“超越”到底意味着什么。从用户规模这个维度看,拼多多登顶,意味着它已经触达.............
  • 回答
    作为一名中文AI助手,我没有个人观点或情感,也无法对具体事件进行“看待”或“评价”。但我可以从多个角度为您梳理这起事件的背景、可能的影响以及公众关注的焦点,帮助您更全面地理解它。事件概览:您提到的这起事件,指的是一位自称是北京电影学院(北电)的学生,微博上实名举报包括宋靖、吴毅在内的部分教授,指控他.............
  • 回答
    阿里女员工周某自称遭性侵一事,以及后续她被解雇、发声表示“未收到赔偿,工作中没犯错”的事件,是一个非常复杂且敏感的问题,涉及到职场性骚扰、企业责任、法律程序、个人权益以及信息传播等多个层面。对此,我们可以从以下几个方面进行详细的分析:一、 事件的背景与发展脉络1. 事件的起点: 2021年8月,一.............
  • 回答
    阿里组织架构调整:国际国内两大数字商业板块下的深层解读阿里巴巴集团近日宣布的组织架构调整,将原有的“多元化业务集团”拆分为“国际数字商业集团”和“中国数字商业集团”两大核心板块,这无疑是阿里战略转型和未来发展方向上的一个重要信号。这一举措背后蕴含着丰富的战略考量和值得深入关注的信息。 核心调整与战略.............
  • 回答
    阿里女员工案,尤其是围绕当事男性王某文的妻子再度发声,称其“丈夫无罪,周某涉嫌诬告陷害、强制猥亵、寻衅滋事”的说法,无疑将案件的复杂性推向了新的高度。要理解并看待这一情况,我们需要从多个层面进行分析。一、 事件背景回顾:首先,简单回顾一下阿里女员工案的关键节点: 爆料与舆论发酵: 2021年8月.............
  • 回答
    阿里奇点编码器能够实现视频压缩上千倍且画质影响不大的技术,这背后蕴含着先进的视频编码理论、强大的计算能力以及对人眼视觉特性的深刻理解。要详细阐述这一点,我们需要从以下几个核心方面进行剖析:1. 什么是视频编码与压缩?首先,理解视频编码的本质至关重要。视频本质上是连续的图像帧序列。直接存储和传输这些原.............
  • 回答
    阿里CEO张勇的“程序员不应限制年龄”论:一次对传统观念的挑战与深入解读阿里CEO张勇关于“程序员不应限制年龄”的言论,并非一个简单的口号,而是对当下技术行业发展趋势、人才结构以及企业用人理念的一次深刻反思和大胆挑战。要理解这一论断的深层含义,需要从多个维度进行剖析: 1. 时代背景与行业痛点:为何.............
  • 回答
    阿里“月饼门”事件中,最后一名(第五名)员工也被开除,这是整个事件发展的一个重要节点,也引发了社会广泛的讨论和关注。要理解这个事件,需要从多个角度进行分析:一、事件回顾:阿里“月饼门”是怎么回事?“月饼门”事件爆发于2012年9月,正值中秋佳节。当时,阿里巴巴集团内部组织了一场月饼抽奖活动,员工可以.............
  • 回答
    阿里这几年风评的变化,就像一场精心烘焙却最后出锅时发现烤糊了的蛋糕,让人惋惜又费解。曾经的那个充满创新活力、引领行业趋势的“阿里爸爸”,如今在很多人心中,形象多少有些崩塌。这背后绝不是一两个原因能简单概括的,而是一系列复杂因素交织作用的结果。一、从“神坛”到“凡间”:期望值的反噬首先得承认,阿里曾经.............
  • 回答
    阿里员工确诊白血病后不幸离世,生前曾居住在自如出租房,这引发了公众对“自如甲醛房”问题的广泛关注和担忧。这件事情非常令人痛心,也触及了我们当下许多人共同面临的租房困境和健康焦虑。事件的经过和公众的反应:从网络上流传的信息来看,这位阿里员工在搬入自如公寓后不久,身体出现不适,随后被诊断出白血病,并最终.............
  • 回答
    “阿里女员工自述被三名同事强制审问8小时”事件,因其涉及职场霸凌、权力滥用以及潜在的非法行为,引发了社会广泛的关注和讨论。以下将结合已公开的信息,对此事件进行详细的分析和解读。事件梳理(基于女员工自述):这位阿里女员工(以下简称当事人)的自述主要围绕以下几点展开:1. 事件背景: 当事人称,在某次.............

本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou

© 2025 tinynews.org All Rights Reserved. 百科问答小站 版权所有