EMNLP2019最佳论文揭晓,约翰霍普金斯大学华人作者与NLP大牛Jason Eisner获奖

2019年EMNLP自然语言处理实证方法会议(Conference on Empirical Methods in Natural Language Processing)上周在中国香港正式闭幕。

本届大会举办了18场 Workshops 、多个Tutorials和主题丰富的会议活动,吸引了超过1922人参会。KAIST计算机学院副教授Meeyoung Cha、纽约大学计算机科学和数据科学副教授Kyunghyun Cho以及IBM Research AI工程师Noam Slonim等知名大咖围绕计算机社会科学、AI系统、深度学习等主题发表演讲。

本届大会主席为日本东北大学教授 Kentaro Inui,程序委员会三名华人主席分别是新加坡管理大学蒋静副教授、德克萨斯大学达拉斯分校Vincent Ng教授、北京大学万小军教授。

详解EMNLP2019

作为自然语言处理领域的顶会之一, EMNLP2019共接收论文683篇。其中465篇长论文,Oral 报告 164 篇,Poster 301 篇,接收率为25.6%。218篇短论文,Oral 48 篇,Poster 170 篇,接收率为20.5%。总接收率为 23.7%,相比去年 24.6% 的接收率略有下降。

EMNLP2019接收论文的分数分布情况如下。可以看出,想要在EMNLP2019发表一篇论文是相当的不容易。去年分数在 3.67分 及以上的论文很少被拒,而今年得到3.67分的论文仍有 30% 以上被拒,要得到 3.83 分才比较保险,这一结果也反映出了NLP研究激烈的竞争程度。

从投稿领域看,EMNLP2019投稿量排名前三的分别为Machine Learning for NLP、Summarization and Generation与Machine Translation & Mulitlinguality。这三个领域也是被接收论文数量最多的三个领域,都有50篇以上论文。

从投稿国家看,EMNLP2019中国和美国提交的论文最多,中国提交了近1000篇论文,美国也有近900篇论文提交。提交论文TOP5的国家如下图所示。

最终,美国成为本届大会被接收论文最多的国家,大概有260篇。中国位居第二,约有200篇论文被录用。

英国约有40篇论文被录用,排在第三位。日本和德国相差不大,都有20篇以上被录用,排在第四位。印度、加拿大、韩国、法国、新加坡、以色列、澳大利亚也都有不错的表现,位于被接收论文TOP10国家榜单之中。

从作者维度分析,被接收的683篇论文,总共来自2186位科研人员。其中有1777位作者1篇入选, 255位作者2篇入选,80位作者3篇入选,36位4篇入选,8位5篇入选,10位6篇入选,4位7篇入选。

单人7篇以上论文入选的共有9人。

只有1位作者有9篇入选。这位大牛就是国内NLP领域的领军人物--哈尔滨工业大学刘挺教授。刘挺是哈工大人工智能研究院副院长、计算机学院社会计算与信息检索研究中心主任。他还是国家「万人计划」科技创新领军人才,教育部人工智能科技创新专家组成员,主要研究方向为人工智能、自然语言处理和社会计算。其所带领的哈工大社会计算与信息检索研究中心(HIT-SCIR)是目前国内顶尖的 NLP 研究机构之一。

腾讯人工智能实验室(AI Lab)自然语言处理中心研究主管史树明、华盛顿大学计算机科学与工程 Paul G. Allen学院副教授Luke Zettlemoyer、阿里巴巴达摩学院新加坡机器智能技术研发中心的高级算法工程师邴立东、北京大学计算机研究所研究员赵东岩都有8篇论文入选。

清华大学计算机系刘知远副教授、腾讯AI Lab高级研究员涂兆鹏博士、南加州大学计算机系助理教授任翔、华盛顿大学计算机科学与工程Paul G. Allen学院的教授Noah Smith 都有7篇论文入选。而Noah Smith、刘知远过去几年在EMNLP都一直有较高的产出。

按照每篇论文的作者个数统计,4人署名文章最多,共有153篇;其次是是3人与5人,各有147和128篇。另外,还有11篇论文拥有唯一作者,还有1篇竟有24人署名。

按照第一作者入选论文篇数统计,共有27位研究人员以一作身份发文2篇。还有1位作者以一作身份发文三篇,他是来自清华大学电子工程系的博士生武楚涵。

另外更牛的一位是来自卡内基梅隆大学计算机科学系的博士生Dongyeop KANG,以一作身份在EMNLP2019发文四篇。此前,他曾在Facebook AI,艾伦人工智能研究所和Microsoft Research以及韩国KAIST研究所实习,被选为NeurIPS18和ACL18的顶级审稿人。他的研究方向包括自然语言处理、计算语言学、机器学习等。

从入选论文所属机构来看,在国外研究界与工业界中,卡内基梅隆大学、艾伦人工智能研究所、爱丁堡大学、加利福尼亚大学、华盛顿大学等论文入选数位居前列,工业界谷歌、Facebook、微软、IBM等依然占据霸主地位。

国内高校中,北京大学、清华大学、哈尔滨工业大学、北京航空航天大学、浙江大学、中山大学、北京理工大学的论文录取数量都排在前列。国内工业界,阿里巴巴、腾讯等企业表现不俗。

总而言之,经过几年的激烈PK,人工智能技术竞争格局的已初步成形,那就是谷歌的霸主地位几乎难以撼动,不过其他战队也出手不凡找到了各自的差异化突破路径。

同时,国内AI力量也保持强劲的发展势头。在近两年的AI顶会上,不论是学术界还是工业界都能看到国人的亮眼表现。

最佳论文奖

EMNLP 2019 也于今日下午公布了最佳论文获奖名单,四篇论文分获两个最佳长论文奖、一个最佳资源论文奖和一个最佳Demo奖。

EMNLP-IJCNLP 2019 Best Paper

Specializing Word Embeddings (for Parsing) by Information Bottleneck

作者:Xiang Lisa Li, Jason Eisner

论文地址:https://www.aclweb.org/anthology/D19-1276.pdf

最佳论文奖一作是来自约翰霍普金斯大学计算机科学系的Xiang Lisa Li,他的导师则是NLP界公认的大神Jason Eisner,他对NLP结构学习领域的贡献极大,曾获得ACL2017年最佳长论文奖。

论文获奖理由是:这篇论文有很好的理论论证与结果,是对预训练词嵌入上使用变差信息瓶颈(Variational Information Bottleneck)的新颖应用。它是很好的语言分析,可能对很多任务都有很大的帮助。

EMNLP-IJCNLP 2019 Best Paper Runner-UP

Designing and Interpreting Probes with Control Tasks

作者:John Hewitt, Percy Liang

地址:https://www.aclweb.org/anthology/D19-1275.pdf

Best Paper Runner-UP的一作来自斯坦福大学,其导师Percy Liang是斯坦福大学计算机系助理教授,曾获得2016年IJCAI计算机和思想奖,Liang可以称得上是机器学习和自然语言处理领域日益崛起的新星,多年来获得了无数学术奖项。John Hewitt的联合导师还有计算语言学的大牛、斯坦福AI Lab主任 Chris Manning。

这篇论文的获奖理由,它是一篇具有深远影响力的论文,它介绍了如何设计、训练、解释探针,以便更全面地评估某种表征对给定任务(如POS标记或依赖性解析)的学习效果。

EMNLP-IJCNLP 2019 Best Resource Paper

The FLORES Evaluation Datasets for Low-Resource Machine Translation: Nepali–English and Sinhala–English

论文作者:Francisco Guzmán, Peng-Jen Chen, Myle Ott, Juan Pino, Guillaume Lample, Philipp Koehn, Vishrav Chaudhary, Marc’Aurelio Ranzato

论文地址:https://www.aclweb.org/anthology/D19-1632.pdf

最佳资源奖论文由Facebook、法国索邦大学和约翰斯·霍普金斯大学合作完成。

该文的获奖理由在于其提供的机器翻译数据集对低资源语言具有重要的意义,而详细、清晰的质量控制方法也值得其他类似的语料库收集工作借鉴。

EMNLP-IJCNLP 2019   Best Demo Paper

AllenNLP Interpret: A Framework for Explaining Predictions of NLP Models

作者:Eric Wallace, Jens Tuyls, Junlin Wang, Sanjay Subramanian, Matt Gardner, Sameer Singh

论文地址:https://www.aclweb.org/anthology/D19-3002.pdf

最佳Demo奖的获奖者来自艾伦人工智能研究所和加利福尼亚大学欧文分校。

这篇论文介绍了一个在AllenNLP基础上开发的开源工具包,它有助于解释基于神经网络的NLP系统。在NLP领域中一个重要的需求就是如何更好地解释“不透明”的神经网络,所以该系统很可能会对更多研究有所启发。

猜你喜欢

转载自blog.csdn.net/AMiner2006/article/details/103008638