我的机器学习之路

版权声明:博客文章都是作者辛苦整理撰写的,转载请注明出处,谢谢!https://blog.csdn.net/m0_37306360/article/details/79780749

时间2018年4月1号,静下心来梳理了一周的机器学习、nlp相关知识脉络,头有点炸,感觉很多地方搞不明白,网上资料鱼龙混杂,有写的好的,也有写的差的,有专门针对新手入门的,也有只有大佬才看的懂的复杂公式,作为一只入门级别的小萌新,自然是想尽各种办法通过各种渠道寻找各种学习资源,在此期间也发现了催生了很多专门培训这一块的培训机构,动不动就是通过几十节课的培训(培训费用也不低)拿到AI的入场卷(大厂Offer),结合起最近也在找实习的经历,实在是感慨万千。真的通过那几十节课的培训就能轻轻松松忽悠面试官?即使忽悠到了面试官,自己对领域内知识的理解还是很虚的吧。然而最大的感概是其实现在入门的学习资料非常多,包括书籍课程,很多都是极棒的,特别是一些英文的书籍资料,真的写的好,还有一些课程,看完简直是茅塞顿开,很舒服(这里不是崇洋媚外啊)。

最近我有一个想法,正好也在准备找实习,要从头学习一些机器学习的知识以及nlp相关知识,我想把我在这个准备过程中学习用到的部分资料整理整理,顺便加上自己的理解,慢慢的写几篇机器学习的基础算法的专题博客。这样做有几个好处,第一,对于有一些想入门的小白可以从我这篇博客中的提到的资料开始,第二,于我自己而言,我对一些算法的理解可能是不到位或者是错误的,希望大佬能够交流指正(像GAN一样互相学习)。

由于本人硕士阶段主要是研究nlp相关问题的,所以这里整理的资料可能都是偏向nlp和机器学习的。这篇博客会根据博主的学习进度以及发现好的学习资源大陆而实时更新。希望大家互相学习一起进步!也以此督促自己勤学多思考。

书籍方面:(大家都应该具备相关的基本高数、线代、概率论等基本知识):
1. 机器学习(周志华):这本书可以当作入门。
2. 统计学习方法(李航):这本书是真的不错,里面也有不少的公式推导。
3. 统计自然语言处理(宗成庆):中文版的自然语言处理书籍比较少,这本书最大的特点就是比较全方面,但是每个地方都是点到为止,大家可以当作地图使用。
4. Deep Learning():话不多说,几位大牛之作。
5. 数学之美(吴军):推荐这本书的理由是因为我当小说看完感觉很不错。
6. PRML(Christopher Bishop):有点偏Bayesian,这本书听说也不错,但是我还没看。。。
7. 待续…

课程方面(有些课程需要翻墙,其实强大的B站就可以看了):
1. Coursera上的Andrew Ng的机器学习课程可以当作入门。
B站链接:
https://www.bilibili.com/video/av14111147?from=search&seid=8596299097758793438
2. 台湾大学的机器学习基石(林轩田)听说也不错。
B站链接:
https://www.bilibili.com/video/av12463015?from=search&seid=5018197974871318943
3. 第三个是我力荐的,台大李宏毅老师的课程,真的是相当不错,主要是讲的很清晰而且简单。另外这个老师超爱看动漫,所以讲课经常穿插动漫人物,interesting。
李老师的个人主页: http://speech.ee.ntu.edu.tw/~tlkagk/index.html,这里有他历年的课程视频以及课堂ppt。
看不了的同学可以去B站上看17年的机器学习课程视频:https://www.bilibili.com/video/av10590361?from=search&seid=5018197974871318943

4.大牛李沐带大家边撸代码边学习深度学习:
链接:
https://mp.weixin.qq.com/s?__biz=MzAxMzc2NDAxOQ==&mid=502882295&idx=1&sn=c611cfd7700fae15581661fbd36d0166&chksm=03906b2b34e7e23d33e2dd21f0e18fabb616202c3b18f96fe354087549ea56ac86d4278a3c1d&mpshare=1&scene=23&srcid=0212PtdQDvxsXWdoHnMzKh5K#rd

开源项目方面:
1. https://github.com//RedditSota/state-of-the-art-result-for-machine-learning-problems
该项目提供了很多机器学习问题的当前最优结果,并尽量保证该库是最新的。并且这个项目类似于众包,希望更多的小伙伴参与进来。如果你发现了一个数据集的当前最优结果,请提交并更新该 GitHub 项目。这是为所有类型的机器学习问题寻找当前最优结果的一次尝试。

2.清华老师刘知远组推荐30来项算法代码和工具包列表:
https://mp.weixin.qq.com/s?__biz=MzA4NzE1NzYyMw==&mid=2247496990&idx=1&sn=1a190f20a9c0876af7c48cecb361303b&chksm=903f0b06a7488210b56cac445fb1039a8e2d8d3ade217816ab9619431227705ce048c80e9030&mpshare=1&scene=23&srcid=0326i36NHdp0Tj8O6y0ZB5Fq#rd

3.待续…

写在后面: 可能现在是个浮躁的年代,但是这种浮躁千万不要带到学习中来,知识的积累绝不是半个月入门,三个月精通喊口号喊出来的,我们需要理智的认知以及勤奋的学习。这个交叉领域涉及的知识太广太广,公式背后的含义是无数人十几年甚至几十年的汗水结晶,绝不是背背公式就能达到彼岸的。今日写此文章,也望大家监督,大家共勉,一起成长~~

猜你喜欢

转载自blog.csdn.net/m0_37306360/article/details/79780749