面试题 上来1分钟的自我介绍,不得不说,中原银行面试,对时间这点的把握还是很紧的。 因为我简历里面,大多是深度学习、计算机视觉相关的项目,但是面试官显然并不整这个,先简单介绍了一个平面物体跟踪的项目,面试官并不懂,就问了我两个深度学习的面试题糊弄过去了:
ResNet如何解决(缓解)梯度消失的 上来也是很懵,因为没想到中原银行会有人问深度学习问题,我准备的都是机器学习的。就凭经验介绍了一下,首先介绍了一下为啥会梯度消失,然后介绍了一下short-cut,残差。现在看了知乎大佬们的博弈,总结一下: 首先,要解决梯度消失,就要知道梯度消失的原因:根本原因就是,链式法则的乘法特质。 基于这个原因,可能导致梯度消失的原因有:选用了不合理的损失函数(激活)、网络的初始化权重过大或者网络过深。按照这个原理,链式法则也可能会导致梯度爆炸,在反向更新中,梯度不断累乘大于1的梯度,最终导致梯度指数上升,但实际上,由于激活函数求导导致的梯度爆炸还是很少见的。 在神经网络的参数更新中,需要反向传播计算的偏导数,由深层到浅层的不断叠乘,。而,激活函数的偏导数一般都是小于1的,在饱和区间近乎为0。所以,随着网络加深,不可避免就会出现梯度未0,也就是梯度消失,参数无法更新。下面粘两个别人的图,sigmoid和tanh的一阶导数图
可以看出, 两个损失函数的一阶导,全部都是小于0的,sigmoid在其饱和区间,近乎为0的梯度。
BN的提出,很大程度上缓解了梯度消失现象,按照之前介绍的原因,BN主要就是使得网络每一层的输入值(上一层的输出值),都从随机分布归一化到标准正态分布,都尽量在激活函数的工作区间(梯度较大),这样就可以延缓梯度消失的进度。
而resnet中的残差结构,就是通过short-cut, 使得在计算残差块梯度时,一直都有快捷连接 x带的梯度1的存在,不至于出现梯度过小的现象。 ∂ los s ∂ x l = ∂ los s ∂ x L ⋅ ∂ x L ∂ x l = ∂ los s ∂ x L ⋅ ( 1 + ∂ ∂ x L ∑ i = l L − 1 F ( x i , W i ) ) \frac{\partial \operatorname{los} s}{\partial x_{l}}=\frac{\partial \operatorname{los} s}{\partial x_{L}} \cdot \frac{\partial x_{L}}{\partial x_{l}}=\frac{\partial \operatorname{los} s}{\partial x_{L}} \cdot\left(1+\frac{\partial}{\partial x_{L}} \sum_{i=l}^{L-1} F\left(x_{i}, W_{i}\right)\right) ∂xl∂loss=∂xL∂loss⋅∂xl∂xL=∂xL∂loss⋅(1+∂xL∂∑i=lL−1F(xi,Wi)) 可以看到,求导公式中,残差块使得其中间的层的梯度,加上了1,使得其梯度不至于过低。 2、深度学习中,几个常见的优化器 这个篇幅过多,下次单开一章吧 3、介绍一下什么是生成模型、什么是判别模型 4、为什么在工业中,判别模型用的较多, 生成模型用的比较少 5、SQl语言中left join 和right join的区别 6、决策树,随机森林、GBDT、XGboost介绍一下
十几分钟就结束了,总体感觉答的还行,就是优化器那里没有准备,答的不太好,希望能进二面吧。
二面应该是部门总管面,只有一个人,我遇到的这个面试官还是比较好说话的,会在尴尬的时候圆圆场(博主没有实习经历,只有两个在写论文的小项目,导师没放实习,面试官还会说导师项目很多,所以没实习是吧,跟着导师确实也可以学习不少东西)。 废话不说,继续面经。
先自我介绍,好好准备一下自我介绍还是好的。
然后面试官让介绍一下,至今为止自己比较满意的项目,和项目中学的东西。然后就巴拉巴拉的介绍项目,因为是计算机视觉的项目,面试官可能涉及不多,就问了一下结果怎么样,因为我这个项目结果的确不错,正在准备写论文就如实回答了,
又问我训练模型用的数据,我用了200个G,万把张图片,也如实说了。
又问了本科和研究生所在学校的情况,和成绩排名之类的。
最后问我有没有什么想问的问题,也不能啥也不问啊,就和一面一样,想了个啥也没有的问题,“贵公司的工作地点在哪里”,然后面试官很细心的给说了一下中原银行总行在郑州的几个工作地点。
最后,老规矩,面试结果在2-3天会通知,期望能在三面中继续见到我,没了。
总结,一面、二面的两个面试官其实都挺不错的,后来去看看别人的面经,感觉我遇到的两个都挺好的。二面过后等了很长时间,一度以为岗位不匹配被刷了(中原银行主要使用机器学习,我用的深度学习)。大概15天,收到了三面通知。
三面本来以为是HR面,可以谈薪资了,没想到还是技术面。也是一个boss面,不过看起来比上次那个严厉些。
上来也是自我介绍,巴拉巴拉
然后,介绍一个你做过的项目吧。按照二面的过程,把之前的话再重复一遍,这次不管用了,面试官给我说深度学习可能不在中原银行(毕竟可解释性差,银行还是得用一些稳定靠谱的)的技术栈里,计算机视觉虽然也有,但是主要是OCR,收人比较少,不一定能分配到计算机视觉。反正就是岗位不匹配吧。后期需要大量培训可能。然后因为博主有java、c、汇编的基础,问我是否有转开发岗的意向。我也不能直接拒绝啊,就说,每个岗位都有自己专属的领域,如果确实有需求要我转开发也可以,(心里想,只要可以写代码就行唉,这傻逼疫情都给小孩逼傻了)。然后,当然我还是更想做数据和算法,因为我自我感觉,我和这个岗位的契合度更高。我有机器学习的基础,基本模型lr、svm和集成学习我都会,而且数据分析库numpy,pandas我也都会基础使用,写代码都有涉及,而且也有将深度学习应用到数据分析的先例。然后就不谈技术了,开始轻松的唠家常。老家哪里的,拿了几个offer,为什么留郑州,不想出去闯闯么,对中原银行了解么。最后,面试结果会在2-3天内通知,具体的后续事项等到过完10.1。10.1过后,中原银行会有一个我们学校的宣讲会,到时候关注一下。就没了,没了。听到让关注宣讲会,心凉一大截,关注宣讲会干嘛,打个复活赛,再说我岗位不匹配。本来都以为凉了,没想到第二天收到人才测评(行测、心理测试)了。
泡池子了,感恩,发个面经,赞赞人品,希望捞我。
某中部211渣硕调参师的辛酸面试之旅。