2019秋招——百度机器学习面经

由于百度是秋招的时候面的,现在很多问题都记不住了,这里只写下我还记得的题目吧(当时太懒了,不想写了。。。):

1.文本分类比赛用的什么模型?为什么?

答:LR、SVM、XGBoost。。。

问:最终选用了哪个?

答:blabla。。。线性核的SVM

问:为什么选线性核SVM?

答:效果最好,特征数目远大于样本数目时,选线性核的SVM比较好。

问:为什么?

答:LR受全部样本的影响,SVM只受支持向量的影响。(感觉有些牵强)

2.文本分类的数据是怎样的?类别标签是怎样的?

答:blabla。。。

3.LR多分类是怎么实现的?

答:softmax层

问:为什么用softmax层,而不用onevsall等多分类策略

。。。不记得了

4.SGD如何改进优化?

答:这里我理解错了,实际上他是想问mini-batch梯度下降。

5.推导带L1正则项的LR,以及如何进行优化的?

答。。。

6.gdbt和xgboost的区别?

答:(经典面试题)。。。

7.树模型、xgboost、gbdt哪个需要做特征归一化?

。。。

8.面对一个任务,如何选择模型?

我感觉这里可以理解为模型的使用场景。。。

9.LR和SVM的区别?

答:(经典面试题)。。。

10.过拟合的解决手段?

。。。

11.CNN、RNN、LSTM的原理?

。。。

12.书写下链表逆序?

。。。。

13.书写归并排序,并优化到空间复杂度为O(1)

。。。双指针

14.几种梯度下降法的区别?

。。。

15.Hadoop相关

猜你喜欢

转载自www.cnblogs.com/wangkundentisy/p/10575830.html