69
社区成员




非科班跨NLP,oc阿里的面试经验:
我的专业是地质勘探类,硕士期间方向是勘探与深度学习的结合,所以转DL/NLP基本属于跨行转码,2020年底开始找了一些入门的教材自学NLP,后来就接触到了七月在线,也是抱着试一试的态度报了NLP小班第6期(最新一期是NLP8),在这次课程之前基本对NLP停留在没有入门的阶段,但在这次课程之后无论从NLP的发展脉络,知识技术,对模型的理解,coding能力,项目的经历与经验都有了长足的提升。所以首先感谢七月在线各位老师长达几个月辛勤的付出。
经历了这一轮的校招,有一些经验想去和大家分享,首先一定要明确咱们要做的是算法工程师,其次才是自然语言处理的方向,所以建议新手玩家如果参加校招,在前一年的11月份就得熟悉基本的数据结构,并开始刷leetcode,常见的数据结构,二叉树,链表,数组等一定要熟悉,常见的算法,二分,快排,动态规划,回溯,等等一定要掌握。只需要保证每天刷2-3题即可,千万不要中断,小流就是你未来的江河。刷题最起码刷到260以上(中等做130,简单做90,困难做40),有很多人说200可以达到大厂的水平,我不太认同,至少每个人的情况不同,建议新手玩家,尤其是转码的,咱们得清楚,要付出更多一点才稳妥。
接着就是NLP的部分了,建议大家找一些系统的,深入的讲解进行钻研,比如你应当先去了解NLP基础的技能,以便于你可以尽快入手,你也应当了解词向量、语言模型是怎么回事,其思想,算法,优化具体是怎么做的,之后又有那些应用,你也需要掌握HMM与CRF的基本原理,会手推是最好的,无监督预训练模型都有哪些,为什么是动态的?,等等,了解这些之后,你还需要去找一些项目去练习,常见的有问答,chatbot,知识图谱,机器翻译等等,自己都要有可以独立coding的能力。
基本就是按照上述的路子,然后在今年3月份开始找实习,陆陆续续也投递了一些大厂和小厂,但都不太顺利,不过仍然是边总结边继续找,后来就拿到了三个实习offer,最后选择了科大讯飞,这样就有了一段实习经历,另外还抽空做了一个关于实体抽取的比赛,7月开始投递阿里,岗位是NLP算法工程师,具体面试的内容相对更加常规,大家只要掌握好基础,问题一般都不会太大
一面视频面(技术leader面,面试官基本是直接带你的人):
Q1:RNN产生梯度消失梯度梯度爆炸的原因是什么?LSTM是如何解决这个问题的?
Q2:做文本分类类别不平衡有哪些处理手段?
Q3:CRF相对于HMM的优点?
Q4:说一下ELMO,Bert与word2Vector好在哪里?
Q5:说一下transformer的结构,模型中是如何处理padding的?
Q6:聊项目
上面的问题相对有固定的答案,项目这部分大家一定得把项目描述的简洁清楚,并且把自己做的内容描述清楚,以及自己的思考和后续的优化。
Q7:coding:爬楼梯问题,m个台阶,一次性可以走1,2,...,n步,总共有几种走法?
经典动态规划,你需要把他做出来,并且把优化的点写出来,状态压缩降低空间复杂度,计算base_case时将递推公式转化为解析形式也是你需要会的?
反问环节:希望面试官能提提意见?
这个环节希望大家重视起来,谦虚地听听人家的意见总归不过分。
一周之后的二面(杭州的部门leader):
Q1:聊硕士期间做的内容?
如果是非科班,建议大家提前想好如何把自己的内容以科普的形式描述出来。
Q2:深挖你的本专业的工作?
这个环节面试官试图去了解你的本专业,所以你仍然需要把专业性的东西描述给外行,只需要坦诚认真即可,而且面试官可能会提出他的一些想法,我建议你保持强烈的好奇心,去了解他的方案。
Q3:一道概率题,A的初始得分是4,B的初始得分是2,每次投掷硬币,出现正面A得1分,反之B得分,A先获胜的概率是多大?
高中组合问题
反问环节:希望面试官可以在专业领域给出一些指引?
HR面:
1.为什么选择阿里,其他的大厂怎么考虑的?
2.觉得最难的问题是什么?怎么解决的?
3.自己最有成就感的事是啥?
4.觉得自己最差劲的地方是什么?
5.给你一个新的任务,你一般的解决方式?
反问环节:当然是希望HR小姐姐可以提一些建议啦
HR面之后两天就收到了意向书,总得来说流程比较顺利。看完这些问题,想必大家觉得这也没什么大不了,事实上只要用心学习,保持良好的态度与坚持的习惯,大家有可以收获心仪的offer,最后再次预祝大家国庆快乐,offer拿到手软!