Posts

Showing posts from August, 2018

2018年上半年NMT研究产出风起云涌

Image
2017 年被认为是神经机器翻译( NMT )变得主流的一年,但这并不意味着 “ 问题被解决 ” ,而且远非如此的是,任何使用这种高级在线机器翻译网站且精通双语的人都可以证明这一点。 而且,没有成千上万也有成百上千的研究人员在研究该问题。到 2018 年中,神经机器翻译( NMT )研究与去年同期相比骤增了 115% 。 2017 年 1 月至 6 月, Slator 在康奈尔大学的自动化在线研究分发系统 Arxiv.org 上发现了 91 篇与神经机器翻译( NMT )相关的研究论文(标题或摘要带关键词 “ 神经机器翻译 ” )。 在今年同一时期,这一数字飙升至 196 。 正如我们之前所提醒的,有一些误报和神经机器翻译( NMT )作为一个活跃领域被提及或被用作测试与更大领域相关假设的实验,如自然语言处理( NLP )甚至机器学习和一般的深度学习。 还有重新提交的问题,即之前发布的研究论文的第一版更新了新信息或者做了更正。 虽然这些论文本身并非独一无二,但仍然会为在该领域开展的研究活动计数。 轻微降温 2018 年可谓是一个疯狂的春天,世界上的一些大型科技公司发表了数十篇论文后, 7 月份的(论文)提交活动与前几个月相比竟然有所放缓。 7 月份仅有 26 篇研究论文提交,其中只有 9 篇与神经机器翻译( NMT )直接相关,且并非之前提交的更新版本。 越来越多的研究论文会将神经机器翻译( NMT )作为最先进的神经网络技术基准而提及。 神经机器翻译研究产出 自 2014 年 1 月 1 日至 2018 年 7 月 31 日期间在 Arxiv.org 上发表的标题或摘要提及神经机器翻译( NMT )的研究论文 这对神经机器翻译( NMT )研究人员来说当然是个好兆头,但也意味着在搜索 Arxiv 数据库时会出现越来越多的误报。此外,随着研究人员更新他们的论文,以前发布版本的重新提交和更新的数量也在增加。 进化中的研究方向 假以时日,自神经机器翻译( NMT )成为主流以来,一般性的研究课题已经发生了变化。 2017 年 11 月 1 日至 2018 年 2 月 14 日期间, Arxiv 上的研究主要集中在这样几个议题上,即提高产出质量和解决训练数据限制(例如资源匮乏语言)。 看看那些参与了 2018 年