年中,面了一个河南理工的兄弟。
把faster rcnn原封不动用Google translate翻成中文,然后发在了一个野鸡中文期刊上,写在了简历上,加粗加黑。
我问:faster比fast快在哪里?
他回:因为对新显卡的支持比较好。
真事。
这周面试了一个候选人,面CV/DL/AI的TechLead。简历很牛逼,做过很多CV的工业项目,涵盖detection, OCR, face recognition, fire/smoke detection等好多项目. 给我们讲了45分钟做得项目,讲得很自信。我挑了一个大项目,我说你在这个项目中的贡献是什么?他说整个项目的所有算法部分都是他实现的。
OK,我开始进行深度学习的技术面。
我先问了两个深度学习的中等难度的问题,他都说不知道。有点冷场,那我赶紧问点简单的吧。我说,深度学习网络,进行分类时有哪些loss?他犹豫了一下,回答: relu.
瞬间把见过大场面的我还有同事都震住了。
首先我个人觉得,算法工程师的目标既不是精通各种框架,会调各种包,也不是会发paper就是成功,而是有能力解决实实在在被提出的算法问题。
这里的问题可能来源于业务,也可能来源于长远的战略部署,甚至可能来源于一次大领导的拍脑袋。不管怎么说,个人觉得能独立分析,拆解,建模和解决算法问题的算法工程师就是胜任的,否则再怎么花里胡哨都是差劲的。
先说一下本文4个样本的背景,甲乙丙丁都是一线大厂的正式员工(包括知名外企),工龄从刚入职到3年不等,不过都不是自己团队的
只是各种原因而接触到的NLP算法工程师。为了避免对号入座,将以下内容中的部分关键词打码
出现一个奇怪现象后,我让他把训练loss画出来,结果他不知道怎么画。然后他不会用xx,我告诉他那就把日志中的loss点提取出来,用*来画。结果他问我*从哪里下载,有没有学习教程。
注:*是一个非常常用的python库
然后又一次,发给他一个非常简单的代码,他想改一下其中一个预处理逻辑,我告诉他在哪里改,他直接说看不懂,求帮他改。我问别人,那他拿着工资每天干什么呢,答曰,可能会写写paper?
结果最后那篇paper也不是他写的。
乙比甲好一些,乙想解决一个问题,于是我给他甩了一篇paper,然后他很多地方看不懂,于是这些细节我一点点给他讲。讲完后他要借鉴其中一个idea用代码实现,这个idea写起来就一二十行。他绕不清矩阵计算,让我教他写,我给他5分钟写完,他很努力的理解了,恍然大雾,拿去跑了,然后跑完觉得很棒,自己又想了一个可能的实现方案,然后问我另一个方案可行性,这两个方案在数学上是等价的,于是讲了等价后,开始问我另一个方案的每行代码应该怎么实现。
小哥哥,你是故意来搭讪的吧?
有一天我把甲的故事分享给了另一家大厂的小伙伴,小伙伴说,还好,他们组刚入职一个新人,第一次做技术分享,给大家讲了半小时的word2vec就结束了,据说,该同学非常费力的直译了论文原文一些内容,专业名词翻译错了他都不清楚,并且表示负采样没看懂,而且不重要,所以就不讲了
问了一下丙后来怎么样了,说被调去做java了,小伙伴反馈丙做java开发还出活挺快的。
丁的故事来源于一个很要好的小伙伴,差点让小伙伴当场离职。丁是另一家很多人都想去的大厂的。丁的能力则是在甲乙丙之上,各种leetcode题刷的贼溜,textcnn之类的也都很熟,今年年初ta的mentor让ta用bert跑一下业务上的一个*分类任务,结果其一跑就是X个月,调了X个月后的结论是不如textcnn好用,线下稍微好一些,线上一塌糊涂。后来我一个刚去的小伙伴接手了ta的工作后,发现数据集里,预处理脚本里,训练脚本和评估脚本里全都有bug,从头到尾完全就是错的。小伙伴给ta修完bug后上升了近XX个点。
注:*取值小于5,X取值大于3,XX取值两位数
丁至今还是在岗的,因为ta的mentor也不太懂这块,mentor认为是bert代码太过复杂导致的,情有可原。
那么问题来了,甲乙丙丁是怎么通过各大厂面试的?靠刷题?靠学校背景?靠不可描述?这个问题我至今没想明白
最后,如果不想成为差劲的算法工程师,请关注微信订阅号“夕小瑶的卖萌屋”!!!
下面是我和小伙伴们四年以来的努力,希望能成为每个算法从业者成长路上的一束光:
看了一圈回答,发现我还没有那么糟糕 谢天谢地
坐标法国,某银行投行。
前年年初,项目主管招进一个data scientist,突尼斯美女,在法国念的博士,机器学习专业,简历上精通Python和R,人工智能算法工程师,某专业大数据咨询公司咨询师。被塞在了我手下,帮我处理数据做深度学习。
一上来先找我要了两篇论文啃。这在法国同事中不常见。顿时觉得,这个博士不光有颜,还有实力。
一个礼拜后我开始让她动数据,布置了几个小任务。半个小时后她过来问我,为什么一个10k的文档读出来size很小。
我至今都记得这两行萌到销魂的代码:
file = "d:\data\test.json" len(file)
九个月以后她辞职了,被一个法国自动驾驶公司高薪聘走。
走之前问我的最后一个问题是,K-Fold和Cross Validation有什么区别。也怪我,为啥常常混着用这两个词。
从此下定两个决心:第一,从此以后所有面试的我都亲自去面;第二,打死我也不相信法国的自动驾驶技术了。
好意外,很多朋友对这个回答感兴趣,那我集中回复一下:
回复的朋友应该是想说,做算法的不等于写读写文件、发送请求这些功能性代码吧。
纯计算机算法出身,刷完了leetcode或者codingame的所有题目,甚至在topcoder或者codejam拿到冠军,你都有可能没有碰过文件操作,虽然可能性微乎其微。但是一个做机器学习算法的没动过文件,这基础也有点差得太离谱了。
当然,如果是只参加kaggle比赛的还是有可能只会写不会读的,毕竟读文件的那两行代码在kernel里已经被写好了。
另外,我带了她九个月,并不完全是根据这两行代码得出的她基础差这个结论。
2. K-fold和Cross validation的区别。
K-fold的全称就是K-fold cross validation。
Cross validation一般有两种,一种是holdout,一种是k-fold。
holdout把数据集分成training,validation和test。这种太基础,很多AI项目都会这样来划分。所以在我们项目里,k-fold等于cross validation等于k-fold cross validation。
只不过我介绍算法的时候,会称为cross validation,因为字面含义比较清晰;调试的时候,喜欢用k-fold,因为动了k。
简单来说,提到莱奥或者梅西,当然可能指不同的人,但是在巴塞罗那足球队的语境里,都是在说Barca No. 10。只不过队友会唤他莱奥,解说会叫他梅西,我会称他球王。
3. 法国工程师。(一家之言,而且仅限计算机领域的讨论)
同事应该是凭借美女博士的光环赢得的项目主管(也许还有博士导师?)的芳心,毕竟项目主管不懂技术,觉得一个博士文凭说明一切。
可惜,法国的博士答辩,评审团是由非本专业的教授组成的。同事40分钟的答辩时间里,有将近半个小时在用男女学生分类这个最基本的AI场景介绍什么是机器学习和人工智能。估计下面坐着的评审团想着自己居然听懂了这么复杂的一个领域,一乐呵,就让她过了。
而且她本科和硕士是在突尼斯国内读的,博士才去的法瑞边境某个我没听过的学校,并不能代表大部分法国博士毕业生的正常水平。
事实上我之前在某大数据公司的博士同事,和我现在身边的大部分工程师同事的能力都相当优秀,我从他们身上学到了不少东西。
只不过,法国虽然数学足够厉害,给计算机算法这个高度依赖数学的领域提供了强大的理论支持,然而IT工业界对算法的重视程度普遍不高。
去年我在被现在就职的银行内转的时候(之前是在这里做咨询),还和一个技术面的面试官就面试题应不应该考算法有过争论。我认为我之前上机做的笔试题目考察的都是写工业代码的能力,而我更喜欢做的是算法和优化。虽然笔试分数还不错,但是我没有表现出真正的水平。面试官反问我,难道之前我做咨询的时候用到过什么精妙的算法吗。我只能把我之前写的一段动态规划加分治的优化代码给他看,然后告诉他,我用这段代码把我们组处理数据的速度提高了三十倍。他就不说话了。
也许法国人对量子计算机时代的到来信心太足了吧。
4. 美女。
我们大组之前有两位公认的大美女,都来自突尼斯。身边的男同事们,一见到这两位,我几乎都能听到他们咽口水的声音。前年年底前后脚走了。
两位之一,我的这位同事,辞职之后离职之前的三个月,基本每天有至少两个小时在陪某几位男同事们聊天。用的阿拉伯语,听不懂。反正那个时候我也是在做咨询,干好自己的任务就好,别人的事情主管都不管,我更管不着。
毕竟我已婚,提不起兴致。
毕竟老婆大人也逛知乎。
看到评论里针对cross validation这一部分还有一些争论,那我还是再修改一下,防止有朋友拿我这段本来只是想调侃一下的并不算严谨的答案去回答面试问题。
另外有一些延伸的奇技淫巧,包括但不限于:
至于不同方法的分类,有的根据是否完全遍历(exhaustive),有的根据是否交叉循环,没有统一的标准。就好像足球运动员可以根据位置分成前锋和后卫,也可以根据国籍分成南美和欧洲,没有哪个分类的方法是错的或者是唯一的。具体使用哪一种或者哪几种,是一个分析了数据量、数据类型和模型复杂度以后的综合决定。
这样回答不敢说没有漏洞,但是应该稍微严谨一点了。
本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度,google,bing,sogou 等
© 2025 tinynews.org All Rights Reserved. 百科问答小站 版权所有