如何阅读研究性论文?

原文:Advice on building a machine learning career and reading research papers by Prof.Andrew Ng

如何通过阅读研究型论文来有效的和相对快速地学习? 如果你想通过阅读学术性文献进行学习,无论你是想搭建一个感兴趣的机器学习项目/系统,或者仅仅是想获取更多最新的有关深度学习前沿知识,你应该怎么做?

下面我们会给出了一些基本的方法:

  1. 创建一份论文清单:试着列出一份你所关注领域的的研究性论文,或 Medium 文章,以及任何你拥有的文本或学习资源清单;
  2. 略过该论文清单。你应该以一种并行的方式阅读研究论文,意思是一次处理多篇论文。具体来说,试着快速浏览并理解每一篇文章,而不是全部读完,对于每一篇文章,也许你只读了其中的的10%到20%,这可能足以让你对手头的文章有一个高层次的理解。 之后,你可能会决定删除其中的一些论文,或者只是浏览一两篇论文,把它们通读一遍。

关于到底需读多少论文,Andrew Ng 给出了指导:

  • 如果你仅仅是想实现一个语音识别系统,那么阅读有关语音识别方面的 5-20 篇文献就足够了,但是如果你是想研究该领域的前沿问题,那么5-20篇论文可能还不足够。
  • 如果你想对某领域,比如语音识别的应用,有一个好的理解,那么你可能需要读 50-100 篇该领域的文章。

那如何阅读一篇论文呢?

对于一篇论文,不要从头读到尾,相反,要多读几篇,下面是具体的方法:

  1. 第一遍:阅读标题、摘要和图表。通过阅读标题、摘要、关键的网络架构图,可能还有实验部分,你将会对论文的概念有一个大致的了解。 在深度学习领域,有很多研究性论文都是将整篇论文总结成一两个图表,对此,我们不需要费力地通读全文。
  2. 第二遍:阅读引言、结论、图表,跳过其余的内容。 引言、结论和摘要是作者试图仔细总结他们的工作的地方,以便向审稿人阐明为什么他们的论文应该被接受和出版。 此外,浏览与本文工作相关的章节(如果可能的话),这部分的目的是突出其他人所做的工作,这些工作在某种程度上与作者的工作有关。 因此,它可能是有用的,但如果你不熟悉该领域,有时很难理解。
  3. 阅读论文,但是跳过数学公式。
  4. 通读全文,略过没有意义的部分。伟大的研究通常意味着我们是在知识和理解的边界上发表东西。当我们阅读论文(甚至是那些最有影响力的论文),你可能会发现,论文的某些部分可能用的很少或者根本某有意义。 因此,如果你读了一篇论文,其中一些内容没有意义(这并不罕见),那么你可以先略读。除非你想要掌握它,那就花更多的时间。

当你阅读一篇论文时,试着回答以下几个问题:

  1. 作者试图解决的是什么?
  2. 该方法的关键要素有哪些?
  3. 对你有什么用(或者说有哪些可以借鉴的)?
  4. 有哪些其它的参考文献可以参考的。

如果你能回答上述几个问题,通常可以反映出你对该论文有了比较好的理解。 事实证明,当你读的论文越多,通过练习你获取到上述信息的速度也就越快。因为,很多作者在写论文时使用的是通用格式。

理解一篇论文需要花费多少时间?

对于刚接触机器学习的人来说,理解一篇相对简单的论文可能需要一个小时,这并不罕见。但是,有时你可能会偶然发现需要3个小时甚至更长时间才能真正理解的论文。

如何获取到这些论文?

网络上有很多好的资源。比如,对于新手来说,那些列出了语音识别领域最重要的论文清单的博客可能非常有价值。

随着深度学习的快速发展,很多人都试图跟上它的最新水平,了解最新进展。因此,这些是你应该经常光顾的地方。

  • Twitter。 令人惊讶的是,Twitter正成为研究人员发现新事物的重要场所。
  • Reddit 中的 ML 子板块
  • 重要的机器学习会议:NIPS、ICML、ICLR
  • 朋友:找一个对该领域感兴趣的社区或一群朋友,分享有趣的研究论文

如何更深入的理解论文中的数学公式?

试着从头开始重新推导。虽然,这需要一些时间,但这是一个很好的练习。

尝试编码实现

  1. 下载源码(如果能够找到),并运行。
  2. 从零开始重新实现:如果你能做到这一点,这是一个强有力的信号,说明你已经真正理解了手头的算法。

不断进步

继续学习和变得更好的最重要的事情是更稳定地学习,而不是进行集中密集的活动。 与其在短时间内死记硬背,不如下一年每周读两篇论文。

猜你喜欢

转载自www.cnblogs.com/offduty/p/11811947.html