写在论文里的算法和具体的工程实现是两个完全不同层面的东西,前者是全人类的共同财富,不应该也限制出口,也几乎做不到限制出口。不过从另外一个角度来讲,写在论文里的算法是没有商业价值的——因为通过数据集训练也好,落地部署也好,针对实际环境做优化也好,都需要进行大量针对性的测试和调整,这也就是为什么FB发了一堆论文,可实际的短视频产品却被TT按在地上打的原因。
也就是说,我国限制出口的“基于数据分析的个性化信息推送服务技术”,是AI算法的工程实现,也就是一个具体的计算机软件系统——显然这就完全不一样了。首先它确实是中国工程师的劳动成果,也直接关系到中国的信息安全,国家安全和互联网主权,因此进行出口管制是必须的;另一方面,对一个日活上亿的app使用的推荐算法,从代码到数据再到二进制文件(显然只有代码是没有用的),容量数以PB计,想把它们转移走的唯一方法是卡车拉磁带…由于国内各大数据中心都在网信办严密监控下,如此规模巨大的数据转移,想要瞒过网信办显然是根本不可能的。换句话说,出口管制在物理上是具有可执行性的。
另外,不光是算法本身,针对某一个具体的,亿级日活的App的工程系统实现,也是具有不可替代性的——大厂程序员应该都见过各个公司内部的各种根本没有人敢动的屎山代码。这些屎山被公司内各种业务系统广泛地依赖着,稍微改一个地方都有可能导致各种意想不到的问题。对于这种巨型App来说,如果一座屎山突然间凭空消失,那么对于App本身会带来灾难性的后果——因为这座屎山消失必然会导致大量依赖它的系统停摆,而“自己实现一个系统”完全等价于“原样复现一座屎山”,显然这在软件工程上是根本就不可能实现的,摆在继任者面前的唯一选择,就是把整个App的所有相关系统都重构一遍。至于这么做的工程量嘛,基本上也就跟完全重做一个App区别不大了,如果不是难度更大的话。
顺带一提,你乎这两天不断地有人发诸如“用移动硬盘拷走算法”这样的神论——然而实际上,数据中心的服务器从物理上不支持连接移动硬盘…磁带机使用的是专用的数据接口。
本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度,google,bing,sogou 等
© 2025 tinynews.org All Rights Reserved. 百科问答小站 版权所有