百度无耻的岂止搜索引擎

读完方可成老师写的「搜索引擎已死」,勾起了一点关于百度往事的回忆。有感而发。


百度于1024日公布了自己研发的 STACL 系统(Simultaneous Translation with Anticipation and Controllable Latency,带有预测和可控延迟的即时翻译),据称能在译者开始讲话后几秒钟,而不是说完一段话后,就开始进行几乎同步的翻译。

如名称所示,上面讲到的「几秒钟」实际上是一个可控制的时长。当你需要在两种关联性相对较强的语言间互译时(比如说法语和西班牙语),STACL 差不多能做到隔开一个词就开始翻译。而当两种被译语言差距很大时(比如中文和英文),系统在翻译前要等待的时间就可能会久一些,只有这样才能保证更好的准确性。

百度官方发布的关于STACL系统的博客公告里提到STACL系统的重大技术突破:

We tackled this challenge using an idea inspired by human simultaneous interpreters, who routinely anticipate or predict materials that the speaker is about to cover in a few seconds into the future. However, different from human interpreters, our model does not predict the source language words in the speaker’s speech but instead directly predict the target language words in the translation (我们受人类同声传译启发并采用这一想法来应对挑战,他们经常预知或预测说话者在接下来的几秒中讲的材料。 然而,与人类口译员不同,我们的模型并不预测说话者的源语言词汇,而是直接预测翻译中的目标语言词汇。) .

以下是百度解释的方式:

“wait-k”,即总是翻译说话者语音后面的k个单词以允许预测上下文。系统经过训练,使用源句子的可用前缀来决定翻译中的下一个单词。

在例子Bùshí Zǒngtǒng zài Mòsīkē(布什总统在莫斯科)和英译“President Bush”中,ķ=22个词落后于中文,我们的系统准确地预测,下一个翻译的单词必须是会见,因为布什很可能在莫斯科会见某人(例如普京),早在中文动词出现之前。

STACL的另一个关键优势是延迟灵活性。它可以设置得更低或更高,取决于两种语言的相关程度,例如,法语和西班牙语较低,英语和中文等远程语言较高,或英语和德语等不同单词顺序的语言较高。

翻译质量更常见的是低延迟要求,但与传统的全句(例如非同步)翻译相比,我们的系统在质量上只有很小的损失,百度写道,考虑到低延迟要求,我们将继续提高翻译质量。

那么STACL与人类口译员相比如何呢?根据百度的说法,它比传统的全句翻译少了3.4BLEU点(bilingual evaluation understudy,“双语评估替补的缩写,是评估机器翻译文本的标准指标)。在中英文同声传译中,AI系统落后于中文语音大约三秒钟,翻译质量比全句(非同步)翻译低3.4BLEU点。

STACL翻译系统发布当天,立即引起了国内外各大知名媒体的纷纷报道:

其中评价最高的是「IEEE Spectrum」,认为百度开发的这个新系统,揭示了一种通过预测未来而保持稳定的翻译工具,可以与联合国会议期间提供同传服务的口译人员相媲美,让人们离软件巴别鱼又近了一步(The Chinese tech giant Baidu has invented a translation system that brings us one step closer to a software Babel fish)。
「南华早报」评论:随着百度新的翻译系统亮相,百度向谷歌发起了挑战(Baidu to debut simultaneous machine translation in latest challenge to Google)。
「量子位」评论:百度宣布AI同传最新突破!能预测,低延时,演示效果惊人,外媒称媲美人类翻译。
「凤凰网」科技:媲美联合国同传,百度听清在2018百度世界大会的挑战。
Fortune」:Baidu Looks to Amaze With A.I. Translation in Real Time(百度AI实时翻译效果惊人!)
CNBC」:China’s Baidu challenges Google with A.I. that translates languages in real-time.
Silicon Angle
的标题就更吓人了:Baidu creates the world’s first simultaneous translation system.

听起来是不是很厉害?当天甚至由于报道的知名媒体过多,百度于是直接在其Demo视频演示的GitHub页面上挂上了各大媒体的Logo

于是在1027日,也就是STACL系统发布的第三天,我也没忍住兴高采烈地在两个「翻译技术交流与资源共享」微信群中向近一千名翻译朋友果断做了推荐。毕竟连CNBC的报道里也提到的这次突破的重要原因,百度的预测功能是基于200万对中英语料库。

然而,好景不长,眼见他起高楼,眼见他楼又塌了。就在中外媒体纷纷对这一技术突破奔走相告一周而已的112日,语言服务行业的重要媒体「Slator」发布批评性报道,「The Art of Hyping Machine Translation」(机器翻译的炒作艺术),文章再次揭露百度的流氓与无耻本性:

Baidu is China’s top search engine, one of the country’s leading proponents of artificial intelligence, and an excellent study in public relations handiwork.(作为中国最大的搜索引擎,百度不仅是该国人工智能的主要倡导之一,更是公关艺术的优秀专家。)

百度PR部门将新闻稿、研究论文、以及GitHub演示页面打包发给了众多媒体机构(这其中就包括Slator)。几小时后,媒体报道铺天盖地:MIT Technology ReviewEngadgetCNBCSCMPFortune等等等等。

Baidu ResearchGithub演示页面上甚至集中挂上了该论文获得的媒体报道链接和媒体Logo。虽然这些报道失实,但是由于是重要媒体站台,该报道得到了更多其他媒体的疯狂转载。

而作为PR的一部分,百度在111日的百度世界大会上进行了STACL的公开演示。大会期间,主显示屏两侧的两个屏幕分别显示了自动语音识别输出和STACL的即时翻译。


但是,现场直播中的同声传译仍然是由人工口译员提供。

关于STACL的翻译效果究竟如何?研究者分别做了英-德和中-英方向的任务实验。在wait-5-model模型(即系统等待5个单词后开始翻译)中,STACL的输出质量略差于炒作效果。而在wait-3-model模型(即系统等待3个单词后开始翻译)中,系统预测的词则是完全错误的。

Slator同样采访到了NMT(神经机器翻译)领域的专家,请求他们发表对于STACL系统的看法:

NMT领域的专家、Iconic Translation Machines的联合创始人和CEO John Tinsley表示:在判定每一项新研究是否为突破(breakthrough、即此次各大媒体在报道STACL时用到的词)时,我们仍需极其谨慎。

都柏林城市大学Andy Way教授则表示:如果这(STACL)不是支持口译人员的工具,而是打算要取代他们,那么我认为,根据我的经验,你该了解我会对此说些什么(“If this is not a tool to support interpreters, but instead is intended to replace them, then I think you know based on my track record what I would say about that.” )。

System GlobalCTO Jean Senellart博士则直接表示:这根本不是什么科学突破(“Not a Scientific Breakthrough”)。百度的公告不过制造了很多噪音(”the announcement made a lot of noise “)。

写到这里,我还能说些什么。我向来不惮以最坏的恶意来揣测百度,却不曾料到他们竟然无耻到了这个地步!


Reference
Baidu Research Blogresearch.baidu.com/Blog/index-view?id=107
官方Demo演示:https://simultrans-demo.github.io/
Paper地址:https://arxiv.org/abs/1810.08398

Comments

Popular posts from this blog

翻译推荐:纸托邦

商务邮件的基本礼仪