一个清华学生的简历,基本再好也就是,吹GPA多高,排名多高,吹发过几篇水文,吹自己懂什么什么技术,吹自己拿过什么国家奖学金
一个MIT学生的简历则可以是这样的,我读本科期间办了一个科技公司,拉到了几个密林的投资,我们的技术现在应用在什么什么上,产生了十几个专利,为社会创造了多少多少价值,极大的提升了人们在某些方面的生活品质。某top技术公司正在想收购我们,给出了多少多少报价。同时我在业余时间为什么什么开源项目作出了核心的贡献,同时把这项技术以公开课的形式推广到整个技术社区,全世界一共有几百万的人注册上过这门课。
我现在比我小8岁的老板的简历基本就是上面这样的。
现有最佳答案 @珵cici 在大面上已经说的很完善了,这大概也是一般人需要的对国外名校(主要是美国,英国情况不了解不敢乱说)和国内名校差异的比较。我有幸在清华计算机系和斯坦福计算机系两个最好的人工智能实验室呆过一段时间,就瞎扯一下我看到的,对学生(研究者)而言的问题,算是对原答案的一个补充,也算借这个机会把一直想写的东西写出来。
先说对学生。业界联系、地利人和(硅谷+校友)这种大家都看得到的自不必说——比如,毕竟并不是所有学校都能造出(至少是经手)Larry Page这样的人才。给我感触最深的一点是,到斯坦福才算真正理解了一句“国内老师是讲书的,国外老师是写书的”的差距。如果说一门传统意义上的数学课——至少是数学知识要求比较高的课,上课的时候几乎所有人都全神贯注,偶尔还会跟着老师的玩笑全班大笑;老师经常用各个专业的问题类比正在讨论的问题,或者举浅显易懂的例子帮你理解,让课堂上的同学都觉得学这门课是一种乐趣——你一定会惊讶。我们对数学课(尤其是大学数学课)的印象多半是照本宣科、催人睡下,更别说让人心情愉悦、积极课堂互动、开拓思路了;或者应该说,除了班上少有的几个数学方面比较有天赋的同学之外,大多数人不能从这些课里体会到这些数学知识的魅力。对了,我是不是忘了说,我说的这门“有趣”的数学课是课号300系列的,1xx是本科基础课,2xx是本科进阶/研究生基础,3xx是研究生进阶课(通常master会懒得去上)?这(两)门课就是Stephen Boyd开的凸优化I和II (EE364A/B),也是Convex Optimization课本的作者(之一)。援引Boyd原话(大意):“... In many parts of the world they are teaching this course wrong. They spend the whole time talking about the first couple of chapters in the book, but the really useful things are in the second half.” 凸优化I让学生学会将一个给定问题建模/近似到凸优化问题并用现有的优化软件解决,而II则深入浅出地穿插了四十年来凸优化领域各种算法的发展——以一种正常人听得懂、并能体验得到其中原理奥妙的形式。如果你想说这只是个个例,我可以说我听过的许多在清华会显得枯燥乏味的理论课或者导论课,在斯坦福都有很好的体验。当然也有一些课在清华的讲授专业性远强于斯坦福(本科课程),但这和国内外本科教育思路不同有关,在此就不深入探讨了。只能说,个人感觉是,如果你知道你最感兴趣的专业是什么、知道今后想从事什么方向的工作,国内本科无疑是很好的选择,因为你会受到更系统、集中、深入的专业知识教育;但如果还不知道自己想做什么(大多数人的情况),那国外灵活的本科教育能给你更宽阔的视野。
另一方面是科研设施和实力的差异。之前说过有幸在清华和斯坦福最好的AI实验室分别混过一段时间,而里面给我感触最深的就是:按照清华这种做研究的方法(如果保持不变),有再聪明的学生,想赶上斯坦福的实力也非常困难。以下是两个实验室我接触到的部分的对比:
1. 计算资源:
清华这边有三四个刀片机,一半是ubuntu的一半是windows的,8核CPU,16G内存;另有大机器上有两块显卡,不记得具体型号了,应该是12年左右最先进的GTX(所以应该是600系列的,这挺好的)。每台机器是独立的,独立文件系统、帐号系统,没有统一登录的方式(想用机器就得请实验室工程师在每台机器上开帐号)。
斯坦福这边光这个实验室就有近百台服务器组成的集群,其中最差的机器配置是8核24G内存,而且在几十台机器上配置了集群队列(cluster queue)方便提交分布式任务(在一台机器上跑一个命令,就可以把计算任务分布到几十台机器去)。另外所有机器都共享一个网络文件系统(Network File System, NFS),也就是说你在所有机器上看到的目录结构和文件都是一模一样的,这进一步方便了计算资源的优化利用。你问为什么?在清华我需要把一个程序在两台机器上分别跑(不同的设置)时,我需要先把我所有的程序、数据都拷到每台机器上,再分别登录运行;在斯坦福拷一次,登录一台机器,然后提交10个任务到集群队列就可以方便地把十个设置放到十台机器上同时跑了(比如machine learning里经常需要做的model selection)。另一个角度看,同样需要1000个CPU小时的工作,放在清华很难操作的两台电脑上(另两台是windows的我几乎不用)要跑500个小时也就是三周,而且如果中间数据或者代码需要改动重来,每次改动可能都要1个小时分别拷文件;如果给我五十台集群机器和NFS,今天早上部署好,明天吃早餐的时候就能看到完整结果了,并且修改的代价不是50倍(和机器数量无关)。顺带提一句最好的机器:他们某年(应该是12/13之中的一年)花大代价做了一个16台机器的集群,每台有64(还是128)G内存,两块GTX680显卡,而且所有机器都配有InfiniBand网卡用于降低通信延迟。这个东西的意义?Google猫脸实验用了1000台机器跑了3天,他们用16台在一周之内就能重现。
2. 技术支持:
清华的实验室貌似只有一位工程师,印象中我麻烦他做的唯一的事就是为我分配在刀片机上的帐号密码。此外,刀片机的系统是由高年级博士生维护的,出了系统问题或者需要安装什么包,就得找有管理员权限的这些学长学姐们(主要是学长们)。找不到人?明天吧。
斯坦福实验室和整个计算机系共享一个技术支持团队,他们负责所有有关计算集群、NFS、帐号权限(之前说过了一个帐号通用所有机器的)等等的管理,工作时间给他们的邮件列表反映一个问题,基本上十分钟之内就会有人跟进(做过技术支持的可能听说过ticket tracking system,他们用的就是类似的系统,责任分到个人)。这个团队为整个计算机系服务,是一个专门的技术支持团队,所以一方面避免了资源浪费(不用每个实验室配备专人),另一方面也提高了专业性和时效性(所有人对所有系统都比较清楚,因为是他们维护的,而且不用非得等一两个人有空的时候才能解决问题)。个人感觉最好的是,这大大解放了研究者的生产力,让他们不需要过分关心一些麻烦的系统问题而浪费时间。
3. 传承
在清华的实验室里,这个概念比较模糊。一方面可能是因为大家的研究方向差距很大,很少在同一个问题上有明显的交集,也就导致了“没有太多经验给下一届”的状况(当然很多做热门科研的学生外流也进一步恶化了这一状况)。另外,在实验室方面,基本上大家会用计算资源就行了,会windows远程桌面和SSH基本上就能解决一切问题,没有什么复杂的工具需要传承。
在斯坦福,计算资源方面使用起来有一些需要注意的问题(cluster queue等等),所以有很多届前的学长留下的文档现在仍然在流通;而为了更好利用计算资源,也有大神花半年时间潜心钻研,写了一个复杂的分布式GPU库(用起来很方便),现在实验室几乎所有的实验都还在用(就是复现猫脸paper背后的技术)。具体研究方面,由于很多本科生、硕士生会进组做研究,有的博士生也维护了一些“入门阅读”的列表,供后来的学生参考。
总的来说,清华的科研情况和实力(按照我回忆的情况)和斯坦福(也可以推想其他顶尖学校)还有“数量级”(这个词借自一个说Google和Baidu的帖子)的差别,其实清华人的研究实力不比他们差,但种种因素限制了我们的视野、能力和工作效率。
总结:其实这些差异都不是清华(国内教育)的错,我们起步晚、投入少,能走到今天已经实属不易。但须知巨轮远航不能靠木匠,闭门造车就只能瞎想,坐在乌龟背上追五百里之外的阿喀琉斯,我们的路还远,但切忌让乌龟蒙住了眼睛,却不学忍术。
共产主义政党长期治理的喀拉拉邦在印度处于人类发展指数的前茅,这就是共产主义对印度的影响。
另外,南亚人是非常非常喜欢取经名的。这也是一个地域特色了。