我的机器学习过程

转眼之间，自己已经从一个学生变成了一个工作一年多的西二旗的IT民工了，记得自己大一的时候懵懵懂懂，高三之前甚至连网吧都没有进过，记得高考查分数的时候，怎么查都不会，分数还是班里一个关系较好的女生给查的。
我开始接触机器学习的时候是大四，当时刚刚参加完ACM亚洲区域赛，学校里面让我们选择毕业论文题目，我在老师的推荐下选择了毕业论文的题目：基于文本主题的新闻推荐。选择完题目之后，就开始学习机器学习相关的东西了。
选题之后毕设老师并没有给与太多的指导，只是让我们查资料，看书。我看的第一本机器学习相关的书是《统计学习方法》，第一个机器学习算法就是决策树，看的一知半解，很多名词不知道什么意思，比方说特征，特征选择，信息熵什么的，也就不太可能看的明白了，后来就放弃看这本书了，转而就去看《机器学习实战》，上网看别人推荐的，但是发现这本书确实不适合我，理论实在是太少，并不适合初学者，又转而去看周志华的《机器学习》但是发现也不怎么看的明白，因为书中很多理论或者等式都是“显然”，“容易证得”，最终自己陷入了一个茫然的阶段，不知道如何处理这些问题。
因为自己在ACM亚洲区域赛中获得了银奖，所以最后在Ryan的内推下，去了百度实习，接触到了很多厉害的前辈，Ryan平时也在代码和理论层面上给与了一些指导，在实习的时间里面，下班时看理论，有的东西不是很明白问问前辈，代码层面上也有了很大的进步，上班的时候在完成任务的同时也阅读了别人的代码。
实习结束过后，我很快就将本科毕业论文的实验做完，在做实验的过程当中发现，在百度实习的这段时间里，自己有了很大的进步，无论在代码层面上还是理论层面上。在这里还要感谢Ryan和那几位前辈，给与了我很大的支持。

我的理论学习过程：
我在学习机器学习算法的时候，有一个主线，就是文本分类，我从网上找到了很多文本的数据集，我在学习大部分算法的时候都用了机器学习算法进行文本分类，比如贝叶斯，决策树，LR，集成学习，LSA + KNN，PLSA + KNN乃至后面的深度学习方法。做实验时，比较各中算法。这样在一个主线的带领下，慢慢的很多算法就落地了，一根主线慢慢变成了一棵树。

个人感悟：
在学习机器学习时，大部分时候是需要自己学习，自己理解的，在学习算法时，应该尽量将算法落地，也就是做实验。
但是在整个学习初期，尤其是在刚刚准备的初期，需要有人指导，否则就像是无头苍蝇一样，很难有所突破，就像我在大四初期的时候一样，虽然很多时候别人的指导并不会特别长时间，但是这一层指导会像清风吹开烟雾一样，节约我们的时间，加速我们的学习进程，而且能够加深我们的理解。
机器学习路线

我的机器学习过程

猜你喜欢