先说结论,不能。
老哥也流过接近十几颗芯片。
有参与的,也有主要负责的。
老哥认为,第一要负责的人都是项目负责人。
这个很好理解,成功收益最大,失败必然要抗责任。
验证人员只要需要满足验证的signoff标准即可,功能覆盖率100%,代码覆盖率100%,状态机,分支,条件满足signoff 标准要求。失败和验证人员关系不大。
有同学会问: 这样验证流程怎么会出重大bug?
这是因为,当时定义的功能case是不是真正的所有的功能场景,错的,漏的验证场景都可能有。芯片是最难之一,就是回答关键的验证场景有哪些?如果没有把这些定义好。验证人员即使验证到100%,也解决不了问题。
关键验证场景 case 列表的确定:这个涉及芯片的核心,关键功能性能指标,可能需要整个芯片多个部件都协同工作。这个是designer, 验证leader, 验证人员,项目leader, 产品经理都要参与的事情,普通验证人员只需要按照case列表去写case, 保证case真pass。
关键场景验证,是一个系统工程,不是让验证人员一个人去搞定的。
而这个也是最容易出现bug的地方。
举例来说:你奉老板之命开发一个当今世界上最牛的终端ai芯片,里面cpu, ddr, 总线,ai处理器,mipi,wifi,网络全都有,处理性能要求达到世界第一,老板可以出去吹牛B。每个单独ip,验证人员都验证没问题。但是,你的核心应用是mipi采集来的图像,缓存到ddr中,通过ai处理器识别成潜在犯罪分子,然后把犯罪分子图像由cpu控制通过网络上传到警察叔叔那里。
看,所有部件的都参与上了,这就不是一个人的问题,需要场景的清楚定义的能力。这里包括
mipi速率和能力。
dma速率和能力。
总线的匹配。
ddr的速率。
ai处理器识别的速率和匹配。
cpu交互的效率。
网络处理的效率。
以及这些协同工作的能力。
假设一切都很完美,复杂场景让你搞定,性能天下第一,流片成功。
但是,芯片一用上,警察叔叔发现常常报假警,根本没法用。项目失败了,这算谁的问题?问题定位,发现芯片升温太快,125corner下ai处理器扛不住,误识别率很大。如果带风扇环境又不允许,风扇也是有寿命的。为了吹世界第一,搞芯片太大,太大功耗扛不住。所以流片失败不能怪验证,责任只能项目负责人来负责。
还是那句话,芯片是一个系统工程,风险点,关键点的识别是产品经理,项目leader的首要事情。小公司有时候这两个岗位还可能是一个人。
一将无能,流片失败,三军辛苦多年而无所得,更不能再推责任了,否则就更显无能了。
团结大家,总结经验,完善流程,提高能力,复盘复盘再复盘。而不是找背锅侠。
团队人心丧失,更别提什么战斗力了,大家都是甩锅高手,没人敢承担,团队也干不了什么事。
不是有句话吗?“败则拼死相救,胜则举杯同庆”。团队的意义就在此。
因此,老哥不应该会打板子到一个普通验证人员身上。
一个原NV的同事提到台积电的时候咬牙切齿。问其原因,他说台积电因为很奇葩的原因让他们tapeout失败过一次。
某年,NV要搞一个新的芯片,让台积电tapeout和生产。正好遇上台积电要工艺升级之类,那条流水线要暂停4个月。NV就说行啊,在暂停之前还有一个多月,把这个基本好了的先tapeout一下,至少这段时间我们能先看看性能什么的。等2个月后,NV芯片设计的老板告诉员工tapeout失败,they dropped it。
大家开始问,为啥好好要放弃呢,我们设计不好就说嘛,放弃什么放弃。老板说,不是放弃,是drop。
其实,已经有样品做好了,按照流程,应该放手推车上推到仓库。当时生产线离仓库10米,手推车放在20米外。工人就说,没事我拿过去就行,就那么两步路。
嗯,就那么两步路,他摔倒了,"they dropped it"。。。
就这样tapeout失败。
匿名讲个真事。
有次流片回来测试,某个引脚有问题,一上电就漏电,几分钟之内就是一缕青烟,板子带芯片一起烧了。追查发现,该io的esd diode画版图的时候居然少画一层layer,产生了错误的器件。(io和esd的版图和design rule是特别难搞的事,做过的都知道)
调查结果大约是这样,模拟工程师要求版图工程师画成某样,版图工程师发现去掉那层layer之后drc检查就过了,然后跑去问负责design rule的CAD,这样可以吗?CAD说,可以。于是就凭这句转述,一路review都通过。芯片回来大家傻眼。
事后扯皮,该CAD不承认说过可以。老板问,空口无凭,有邮件证明CAD同意了吗?没有。于是黑锅就要模拟和版图工程师背。
处理结果是:
模拟设计经理:降级为工程师,过几个月公司裁员被开
模拟工程师:过几个月同一拨被开
版图工程师:无责,但之后转岗了
CAD:无责
流片失败看是什么的原因,正规/大公司还是会做一定问责的。
我职业生涯中还遇到过一次问责强制他辞职的,但是悲剧的是,同事只有他一个人股票赚钱了。
(强制辞职会要求强制执行股权,结果后来公司垮得太快,公司大家的股权全成废纸了。)
如果流片失败,最大问责是设计总监/项目经理,然后责任才会下查到设计、验证或者后端等上面。
》如果流片失败或有重大 bug,能不能只问责于验证人员工作的不充分?
如果钱都是验证人员拿了,才可以哦。