有哪些关于翻译的podcast值得推荐?

作为一种高效获取有用知识的信息源,播客(podcast)近年来越来越流行。与纸质或
者电子化的文本包括视频这样的内容载体不同,播客似乎有其特殊的便利性,我们可以在看书的时候听,也可以在运动的时候听,甚至可以在遛狗或者洗澡或者做菜的时候就那样随心所欲地放着。

我之前一直喜欢用喜马拉雅,比如听听小说或者笑话或者英语。去年因为一个凑巧的原因,被安利了Castbox这个播客软件,开始听The Daily还有TED以及NPR的一堆东西。

最近突发奇想,想找找翻译相关的podcast,于是我开始Google“翻译+podcast/播客”,发现居然什么都没有,我想一定是我的搜索方式不对,于是又接连尝试了百度、知乎最后到微信公众平台,竟然仍旧一无所获。唯一可以找到的是些什么呢,一个是知乎的热门问题《有哪些值得推荐的 Podcast 节目?》,另一个是利器的这篇《最好听的 23 个英文播客都在这了,快收藏!》,还有《学习日语有什么好的播客 (Podcast) 么?》,诸如此类的种种,可是他们仍然在讲如何提升听力或者提高英语啊。

我有一些失望。

所以今天的推荐,也正是基于以上这样的背景。推荐不分排名,链接有的是feeds,有的是官网,没有feeds的话可以直接在podcast App内使用名称检索。关于podcast的介绍,可能是直接引述官网,或者是栏目介绍。不再做中文翻译,不要问为什么,因为我懒。

PS:而且最终我发现,并非自己的搜索方式有问题,而是中文网络上专门谈论翻译话题的播客的确凤毛麟角,甚至可以说是一片荒芜。

  1. European Commission: Interpretation  http://dginterpretation.podbean.com/
    The Interpreting Service of the European Commission ensures that the citizens of Europe can communicate with each other and with the people working in the EU-institutions.
  2. Speaking of Translation https://speakingoftranslation.com/listen/
    Listen and learn about the language industry.Eve Lindemuth Bodeux has over 15 years experience in the translation and localization industries.Corinne McKay has been referred to as “the translator’s coach” and “the guardian angel of freelance translators.”
  3. The LangFM podcast https://www.adrechsel.de/podcast/
    LangFM tells the stories of interesting people from the world of language: interpreters, translators, dialect coaches and many more.
  4. Troublesome Terps https://www.troubleterps.com/
    The podcast about things that keep interpreters up at night.
  5. ATA Podcast https://www.atanet.org/resources/podcasts.php
    It’s a quick way to learn more about ATA—the people, events, and programs. Episodes are presented as short interviews with podcast Host Matt Baird. Easy to listen to, The ATA Podcast offers you a behind-the-scenes view of how ATA works.
  6. Globally Speaking https://www.globallyspeakingradio.com/podcast
    Globally Speaking is a program for and from localization professionals. And how we help global companies achieve their goals in international markets.
  7. A Way With Words https://www.waywordradio.org
    A public radio program about language examined through history, culture, and family.
  8. The World in Words https://www.pri.org/categories/world-words
    The World in Words podcast is about language — everything from bilingual education to the globalization of English to Icelandic insults.
  9. Marketing Tips for Translators http://marketingtipsfortranslators.com/archive/podcast/
    We translators read and write a lot for work and don’t have much time or energy left at the end of the day to read all the business and marketing wisdom we want to. I solved this by finding some marketing and business podcasts I enjoyed, and listening to them while I was driving, hiking, walking the dog…you get the picture. It’s a great way to consume the information without compromising my client work.
  10. Israel in Translation https://player.fm/series/series-2150601
    Exploring Israeli literature in English translation. Host Marcela Sulak takes you through Israel’s literary countryside, cityscapes, and psychological terrain, and the lives of the people who create it.
  11. Modern Poetry in Translation https://player.fm/series/modern-poetry-in-translation
    Podcast by Modern Poetry in Translation Magazine
  12. DUAL Poetry Podcast https://player.fm/series/dual-poetry-podcast
    One poem in two languages from the Poetry Translation Centre.
  13. NPR Rough Translation: https://castbox.fm/vb/149709932
    France is the place where for decades you weren’t supposed to talk about someone’s blackness, unless you said it in English. Today, we’re going to meet the people who took a very French approach to change that.(Note: This story contains strong language in English and French.)

7种让翻译客户爱上你的方式

找翻译客户很难。

你不能否认。作为翻译,你也一定知道吃了上顿没下顿的感受。所以,当你(最终)得到一些优质客户时,你不想让他们离开,对吧?

问题是,你却不是唯一那个提供语言服务的翻译。还有很多其他公司,同样提供技术、医学或商务的专业翻译。而且可悲的是,你的同行也是你的竞争对手。

你是否曾经Google过你所在的城市/国家提供类似服务的译员?如果没有的话,可以试着这样检索:[语言对][城市/国家]翻译。记住去掉方括号,使用实际的文本值(例如:喀麦隆的土耳其语-法语翻译)。

搜索将返回一个目录列表,公司网站、翻译协会、社媒团体或在线平台—— 包括著名的Proz和 Translators Café。

从客户的角度来看,选择太多了。

这会让他们思考该信任谁。他们可能想和任何一个翻译碰碰运气,并期望他们证明自己是有价值的。如果你足够幸运,你可能将是他们合作过的最棒的翻译,这样他们也可以继续为你提供项目。

以下便是让你的翻译客户爱上你的7条方式。

1、专业

预计到2018年,翻译业务的年增长率将达到6.5%-7.5%,到2020年,翻译业务的价值将达到450亿美元。如果不认真对待,或许你应该离开翻译圈。要么,就成为专业人,做专业事。

从任何潜在的合作开始,展示你的专业知识。反应灵敏,值得信赖,对你的职业做全面了解。

你需要熟知:

-行业标准和最佳实践(合同、价格、发票、优质保证等)
-最常见的专业工具和资源
-新趋势和全球利益攸关方的贡献
-关键事实和行业发展(专业认证考试、机器学习、云技术等)

对这些方面的了解有助于构建潜在客户的信任。他们需要感觉你是他们一直在找的专业人士,并且最终爱上你。

2、大胆

与客户合作也是打心理战。

这并非主从关系(除非你希望如此),而是双方既有权利又有义务的双赢合作。你用你的语言专长来解决他们的翻译、编辑/校对或口译问题;他们给你报酬作为回报。

他们也可以再找一个语言专家,你同时也可能有其他客户。

确保说到做到。请记住,了解自己的价值和表现大胆可以防止你被“虐待”。

这适用于以下情况:

翻译价格

如果你和客户直接对接,请直接提出你通常的收费标准。这是为了让他们明白,你并非只是挣几个小钱。最好的方法之一是让他们明白翻译文档、网站内容或应用程序帮助文件需要花费的时间和精力。关注翻译作品的价值,强调翻译过程的重要性——这并非一个孤立的解决方案,而是更广泛交流的一部分。

对于翻译公司,如果你收费特别高,可能会遭遇阻力。因为他们需要从向最终客户收取的费用中扣除一定比例。但是,你的经验、专长和软件知识可能会帮你拿到一个好价格。

做好灵活的准备,但要事先设定一个门槛,低于这个门槛,合作绝无可能。正如Corinne McKay所言,不要像和中介一样去和客户做生意。

工作时长/天数

一些翻译客户 ——大多是翻译公司——不尊重译者的工作/生活平衡,恨不得他们7天24小时干活。记住,你随时可以让他们知道你什么时候有空,什么时候没空。

避免成为总是说“yes”的人。不要害怕拒绝一些项目或者要求延长Deadline,但你最好懂得如何争取(不可预见的情况,糟糕的源文,格式问题,或者任何不错的理由)。

化解冲突

只要产生关系,必然就有冲突。翻译也不例外。解决冲突即意味着双方都做出让步。如果你觉得问题出在你身上,考虑一下另辟蹊径,因为对你的客户,你可能没你想的那么重要。

3、独一无二

打造个人品牌。

这是在自由译者的汪洋中脱颖而出的最佳方式。给自己一个企业的形象。即使你是个人雇主也没关系。事实上,IbisWorld的一项研究显示,美国大约95.1%的语言行业从业者都是独资经营。

列出你的业务发展价值、建立网站和设计其他线上/线下营销材料。

此外,通过以下方式确保你的品牌形象在所有平台上保持一致:

-在文档中使用相同的配色方案。
-在打印和电子资产上显示您的logo或公司符号。
-使用定制化的社交媒体封面营销自己的业务。
-为商业团体做贡献(专注于帮助他人,而非过度推销自己)。
-须知,第一印象永远最重要。

总而言之,有品牌的翻译看起来比没品牌的翻译要更专业。

4、多走一公里

如果你不仅仅是一名翻译,客户会更喜欢你。

人性总是很贪婪的;能够满足这样的期望会让你与众不同。不要只用你的时间或知识换取金钱。相反,努力成为专业人士——更甚者——客户可以依赖的合作伙伴。

与其提供服务,不如帮客户找到解决方案,他们会因此而爱上你:

-建议他们如何改进他们的流程或与你的协作(更易于管理的文件格式、文档与整个企业愿景的一致性、等等)。
-向他们表明你对他们业务的关心(例如,高亮不清楚的源内容,讨论潜在的解决方案及其对翻译的影响,提供一些他们可以利用的目标国家事实,等等)。
-少承诺,多做事(在设定的deadline前交付,提供方便查看的目标文件PDF版本,分享项目的QA见解/报告)。

与其提供服务,不如帮客户找到解决方案,他们会因此而爱你!

这样的行为也会让你与众不同,更加可爱。

5、友好

翻译业务固然严肃,但这不是你表现得像是机器人的理由。如今,人们越来越在意“人工翻译”和自动化翻译的区别。

所以,在和客户打交道时表现你的“人性”吧。

-例如,在特殊的节日(圣诞节、复活节、斋月等)给他们发送电子贺卡。
-记得经常感谢他们“与你合作”。例如,每当你完成一个项目时,以及在每年年底时,都是如此。特别贴士:在你的发票底部写上“谢谢你和我合作”。

关键是让你的客户知道这边是一个有血有肉的人。一个关心和珍惜职业关系的人。试试这个,你的排名一定会在“客户忠诚度指数”上上升的。

6、谦虚

人无完人。

当有错误时,要及时承认,并承担责任。你不可能每分每秒都是一个好的翻译/编辑/校对。总有一天,你会表现不好。

当客户指出错误时,不要对他们暴跳如雷,也不要用自己的资质怼他们。相反:

-保持冷静(尽可能的),听听他们生气的原因。
-承诺进一步核实问题。
-客观地重新评估你的表现。请向你的同行征求意见。
-回到客户身边,做出相应反应:如果他们是对的,道歉并采取纠正措施。如果他们错了,那就做一名外交官。使用参考资料来支撑你的观点并指明方向。你的目标是保持合作。

下面即是一个鲜活的例子,在这个案例中,我不得不为没有完成任务而道歉。幸运的是,一切进展顺利,我今天仍在和那个客户合作。

7、做自己

既然做不了别人,就做自己。

做自己,让他们尽可能地更喜欢你。宁可让他们讨厌一个真实的你,也不要为让他们爱上一个虚假的你。

这和翻译客户有什么关系?稍等,你马上就会明白。

在一张纸上,画一个两栏的表格。

在第一栏中列出你的(个人和职业)品质,然后在第二栏列出你的缺点。花一点时间,认真对待这个测试。

向你的朋友、亲戚和同行寻求帮助。您可以使用这样简单的范本:

你好,XXX:

目前我正在审查我的个人简历,以期改进。作为朋友/同事/兄弟,你喜欢/不喜欢我什么?非常感谢你的帮助。

收到同行或亲戚的反馈后,填写表格并分析结果。提高个人素质,改善与翻译客户的关系。记住,进步是过程,而非终点。

不时地:

-询问你是否可以做些什么使合作更加顺畅
-要求客户指出他们喜欢/不喜欢你的地方
-和5-10年前相比自己现在进步了多少

几分钟下来,这些方法已经让你的客户更加爱你啦。


翻译:Nansey 来源:cdlancer

一款帮助丈夫“翻译”妻子行为的App在日本问世

一款旨在帮助丈夫“翻译”妻子行为的日本App引起了强烈反对。

日本最大的糖果制造商之一Ezaki Glico,在2月初发布了Kope App,以鼓励伴侣分担抚养孩子的义务。

但是,据《每日电讯报》报道,一个为推广该App而建立的网站因其对丈夫有争议的建议而引起了众怒。

它认为男人和女人可能会因为大脑不同而发生冲突。“由于男性大脑和女性大脑在回路和信号的结构上有所不同,即使他们得到了相同的输入,也会有不同的输出,”它说。

其中还包括进一步的建议,这种建议被描述为“翻译母亲对父亲的感情”,当妻子生气时,这种建议追踪了八种潜在的行为模式,并“翻译”了男人不可信的话语。

该App声称,当女人说“我们在一起毫无意义”时,她实际上是在问,“你对我到底什么感觉?”

而评论“这真的很难”,实际上意味着“你需要对我所做的表达赞赏”。

该App建议男人道歉,如果女人问:“对你、你的工作或你的家庭来说,哪一个更重要?”它会建议回答“我很抱歉让你感到孤独”。

它还建议男人应该迅速将话题转移到他在工作中遇到的问题上,以避开女人的提问。

据《朝日新闻》报道,这款App是由Ezaki Glico的女性员工在内部开发,但是是在Ihoko Kurokawa的编辑监督下开发的,Ihoko Kurokawa已经写了很多关于人际关系的书。其中一本书名就是:《驭妻指南》。

该App在社交媒体上引起了强烈的批评——一名评论员抨击该公司“公开表达对女性的蔑视,因为这不是在认真对待女性的话,而是在惺惺作态地表达同情或感激”。

这家总部位于大阪的公司已修改了App和网站的部分内容,但没有对出版物发表任何评论。“我们会将顾客的意见铭记于心,并每天努力改进,”该公司在一份声明中说。

此前的上个月,一家日本杂志发表文章,就女子大学的学生在酒会上被睡服的难易程度进行排名,随后即被要求为此道歉。

周刊《Spa!》印刷版采访了相亲网站Lion Project的经理Keiji Isogimi,正是该网站对五所大学进行了排名,他说这些大学生在酒会上被睡服很容易。

他还描述了如何“哄”女人,并根据女人的衣着和外表来判断她是否有过性行为。

在社交媒体强烈反弹和一份收集了52000个签名的请愿书指控该文章“对女性进行性化、物化和不尊重”之后,他们发布了一份道歉信。

该杂志的发言人Takashi Inukai说,该出版物针对性写的是男性参与者向女性付费的酒会,他说这样的酒会目前在女大学生中很受欢迎。

在反对性骚扰和性侵的全球#MeToo运动觉醒后,日本发现他们最近正处在尚未承认性别平等的公众视线中。在政治和商业领域的女性代表比例上,东亚国家在七国集团中排名垫底。

去年,日本的一些医科大学承认干预入学考试分数,故意让女性申请人处于不利地位。


翻译:Nansey 来源:INSIDER

字幕翻译笔记:字幕提取

工作缘故,最近需要对公司一个产品的视频宣传片的字幕进行翻译。任务需求很简单,就是中文到英文的转换,视频也不是很长,十分钟都不到。

我没有在字幕组工作过,之前也没有太多这方面的经验,有的只是零星阅读过相关的教程或者网贴,但是早已忘到九霄云外,甚至在拿到任务时候,连应该去下载和使用哪个软件也没有概念。

直觉和热衷各种软件的经验告诉自己,这大概只是使用软件的问题而已。但是很快,我发现我错了。印象里YouTube对于字幕的处理功能和自己困难重重的实操形成了鲜明的对比,我高估了自己的智商。

下面我会讲到在这次字幕处理的过程中遇到的各种问题,这些问题可能是借助搜索引擎并没有那么容易找到解决办法,或者网络上给出了解决办法,但实际的操作却是另一种回事的情况。我不会像大多数网贴一样去不厌其烦地重复各种软件操作的步骤,毕竟那些网帖已经讲得够多够清楚了。

声明一下,我只是字幕处理领域的初学者,所以接下来的写作难免会有纰漏,还望各位多多批评指正。

此次任务使用或者涉及的软件(附下载链接):

gMKVExtractGUI:https://sourceforge.net/projects/gmkvextractgui/
My MP4Box GUI: https://www.videohelp.com/software/My-MP4Box-GUI
Pot Player:https://potplayer.daum.net/
LAV Filter: https://www.videohelp.com/software/LAV-Filters
Codec Tweak Tool:https://www.videohelp.com/software/Codec-Tweak-Tool 

Format Factory:http://www.pcgeshi.com/
esrXP:
https://www.videohelp.com/software/esrXP
Srt Sub Master:
https://mjpclab.net/submaster.html
Abbyy FineReader:
https://pan.baidu.com/s/1RXzDBbD_vrhkw8tHLfbvDA

字幕提取的原理(硬字幕):

1.使用esrXP跑视频抓字幕OCR
2.使用Abbyy FineReader等OCR软件提取文字
3.使用esrXP或Srt Sub Master对字幕进行校对并导出为字幕文件

1. 硬字幕与软字幕

我拿到的视频虽然是高清的(1920*1080),但却是硬字幕。

什么是硬字幕呢?就是字幕像是水印一样嵌在了视频里,使用普通的软件是无法直接提取字幕文件的。和硬字幕对应的概念是软字幕,即视频文件和字幕文件是分离的,可以利用某些专门的软件直接提取。比如Pot Player,比如gMKVExtractGUI(mkv格式视频),再比如My MP4Box GUI(mp4格式视频)等等。

(Pot Player提取软字幕,图片来源于网络)

 

 

 

 

 

(gMKVExtractGUI提取软字幕,图片来源于网络)

 

(My MP4Box GUI提取软字幕,图片来源于网络)

 

 

2. esrXP

对于硬字幕的提取目前普遍使用的软件是esrXP,一个非常古老却又十分有效的工具。有效的同时,调教的过程中又几乎必然会出现种种屡试不爽的「人为bug」,我一度有想砸电脑的冲动。

问题1:视频无法载入,即过滤器页面没有视频预览或者主页面无法运行「开始」。

解决办法: 1.安装LAV Filter解码器; 2.安装并使用Codec Tweak Tool工具设置系统默认解码器(将视频解码托管到LAV Filter); 3.文件名有特殊符号导致无法加载(将文件名改成纯英文或数字即可,网友贡献提示)

那么,执行了问题1解决办法中的步骤后,是否就一定能保证esrXP能够预览和开始处理视频了呢?答案是否定的。视频解码是一方面,另一方面,esrXP并不能够保证对于大多数视频格式的支持(相反的,我觉得这种兼容性比较差)。自己测试了对于mkv/mpg/avi等格式在LAV Filter托管了系统解码后是没有问题的,但碍于时间有限,其他的一些格式并没有进行测试。不过即使是格式不被支持的情况下,使用Format Factory进行格式的转换也是一种解决方式,目前网络上流行的格式不外乎mp4/avi/3gp/rmvb/wmv/mkv/mpg/vob/mov/flv等等,转换时候可能需要注意一下目标视频格式的大小(如果一个较长的视频,采用了体积较大的目标格式,而电脑配置又很一般的话,那将是一种不可描述的灾难),以及屏幕的大小设置(大的屏幕输出对于后期清晰地OCR更加方便,但并非越大越大)。

视频格式与大小的分类:

最小:mkv/flv/rmvb/wmv(流媒体)
其次:mp4/3gp(手机格式)
再次: mpg/vcd/dvd/mov
最大:avi(无压缩)

问题2:视频在可以预览的情况下,esrXP也可以正常运行OCR截屏,但是截出来的字幕全是糊的。

解决办法: 这是我在此次视频处理任务中遇到的最大问题之一,甚至在问了几个朋友后也没有得到答案。网络上给出了各种各样的参数,但也都是针对某个具体视频的方案,并不是一个普适性的解决办法。事实上,对于不同的视频,也没有一个普适的参数设置。

(进阶设置,图片来源于网络)

 

 

 

 

 

 

 

过滤器的进阶设置,这里像是一个高级的复合型滤镜,参数设置得好的话,可以减少后期非常多的校对工作。我的建议是「启动过滤器」进行实时参数调整的效果预览。我只使用了边线和第一阶段的「最高光度」2个参数来调整,最后拿到了满意的输出效果,这也得益于拿到的任务是一个黑条白字的视频,相对于那种字幕浮于视频上面的复杂情况要容易处理的多。

esrXP的过滤原理主要是通过颜色的判断来完成的,且过滤器使用了“HSL色彩模型”,HSL分别对应:

H(hue)=色相 指的是人眼所能感知的颜色范围,这些颜色分布在一个平面的色相环上,取值范围是0°到360°的圆心角,每个角度可以代表一种颜色。

S(saturation)=饱和度 指的是色彩的饱和度,它用0%至100%的值描述了相同色相、明度下色彩纯度的变化。数值越大,颜色中的灰色越少,颜色越鲜艳,呈现一种从理性(灰度)到感性(纯色)的变化。

L(lightness)=亮度 指的是色彩的亮度,作用是控制色彩的明暗变化。它同样使用了0%至100%的取值范围。数值越小,色彩越暗,越接近于黑色;数值越大,色彩越亮,越接近于白色。

了解了HSL色彩模型是什么之后,除RGB差距外,每个过滤选项就可以和HSL对应起来了:

色度差距(H) = 所选颜色的色相差距大于设定值,则会被过滤
RGB差距 = 所选颜色的RGB差距大于设定值,则会被过滤
最低光度(L) = 亮度小于设定值,则会被过滤
最高光度(L) = 亮度大于设定值,则会被过滤
最低色泽(S) = 饱和度小于设定值,则会被过滤
最高色泽(S) = 饱和度大于设定值,则会被过滤;

关于HSL和RGB的背景知识(供参考学习):

HSL:https://en.wikipedia.org/wiki/HSL_and_HSV
RGB:https://en.wikipedia.org/wiki/RGB_color_model

(后处理,图片来源于网络)

关于过滤器中的「后处理」

「后处理」同样会对抓取的字幕产生较大的影响,这里的参数设置也需要考虑到「进阶设置」中设定的效果来进行选择和调整。比如我已经通过「进阶设置」拿到了比较好的预览效果,那么这里的设置就不用再做太多的工作。但是如果「进阶设置」拿到的效果较差,比如说字幕在设置参数后仍然有很多的杂点,这个时候就需要通过移除像素或是区块来优化了。

(字幕管理,图片来源于网络)

关于「字幕管理」中的「高质量」

在抓到所有的字幕帧后,「高质量」对于输出清晰的字幕作用同样非常明显,这将直接影响到OCR的识别率。点选「高质量」可以感受前后的对比效果,这个效果有些像是打印和低质量的复印甚至手写的差别。对于出现的多余相同字幕可以进行合并,多余的杂色和空白字幕行则可以执行去除和删除。

这些工作完成后,可以将字幕进行导出。 esrXP支持导出的文件有:

.esr(保存当前抓取的图像信息以及时间轴)
.ssa(保存ssa字幕文件,且只含有时间轴)
.srt(保存srt字幕文件,且只含有时间轴)
.idx,.sub(保存图形字幕文件,可直接作为字幕观看)
.bmp(位图,用来OCR成文本)

我的处理方式是将字幕文件导出为OCR图片,再使用Abbyy FineReader(当然你可以使用其他的OCR软件)进行文字的提取。提取的文字复制粘贴回esrXP或者直接放进Srt Sub Master进行包括时间轴的校对。

补充一点,导出的过程中需要注意的是,最好在导出之前保存一份.esr工程文件。esrXP作为一个古老的软件,对于大视频的处理,难免有崩溃的可能。一旦崩溃,又得从头再跑一遍,关键很有可能你已经不记得之前设置的参数了。

在Srt Sub Master中则可以直接对着视频进行字幕的调整/翻译/时间轴校对。完成后导出字幕文件即可。

(Srt Sub Master,图片来源于网络)

到这里,硬字幕的提取或者说英文/双语字幕的制作已经完成。至于如何将制作好的字幕完美地封装到之前的视频里进行字幕的替换,对于一个没有什么视频编辑经验的翻译来讲,我好像遇到了一个更大的问题。

不过没有关系,就当这是一个契机,迫使自己去学习翻译领域之外的相关知识,学完后我会继续和各位分享,就像这次学习字幕的提取一样。

百度无耻的岂止搜索引擎

读完方可成老师写的「搜索引擎已死」,勾起了一点关于百度往事的回忆。有感而发。


百度于10月24日公布了自己研发的 STACL 系统(Simultaneous Translation with Anticipation and Controllable Latency,带有预测和可控延迟的即时翻译),据称能在译者开始讲话后几秒钟,而不是说完一段话后,就开始进行几乎同步的翻译。

如名称所示,上面讲到的「几秒钟」实际上是一个可控制的时长。当你需要在两种关联性相对较强的语言间互译时(比如说法语和西班牙语),STACL 差不多能做到隔开一个词就开始翻译。而当两种被译语言差距很大时(比如中文和英文),系统在翻译前要等待的时间就可能会久一些,只有这样才能保证更好的准确性。

百度官方发布的关于STACL系统的博客公告里提到STACL系统的重大技术突破:

We tackled this challenge using an idea inspired by human simultaneous interpreters, who routinely anticipate or predict materials that the speaker is about to cover in a few seconds into the future. However, different from human interpreters, our model does not predict the source language words in the speaker’s speech but instead directly predict the target language words in the translation (我们受人类同声传译启发并采用这一想法来应对挑战,他们经常预知或预测说话者在接下来的几秒中讲的材料。 然而,与人类口译员不同,我们的模型并不预测说话者的源语言词汇,而是直接预测翻译中的目标语言词汇。) .

以下是百度解释的方式:

“wait-k”,即总是翻译说话者语音后面的k个单词以允许预测上下文。系统经过训练,使用源句子的可用前缀来决定翻译中的下一个单词。

在例子Bùshí Zǒngtǒng zài Mòsīkē(布什总统在莫斯科)和英译“President Bush”中,ķ=2,2个词落后于中文,我们的系统准确地预测,下一个翻译的单词必须是“会见”,因为布什很可能在莫斯科会见某人(例如普京),早在中文动词出现之前。

STACL的另一个关键优势是延迟灵活性。它可以设置得更低或更高,取决于两种语言的相关程度,例如,法语和西班牙语较低,英语和中文等远程语言较高,或英语和德语等不同单词顺序的语言较高。

“翻译质量更常见的是低延迟要求,但与传统的全句(例如非同步)翻译相比,我们的系统在质量上只有很小的损失,”百度写道,“考虑到低延迟要求,我们将继续提高翻译质量。”

那么STACL与人类口译员相比如何呢?根据百度的说法,它比传统的全句翻译少了3.4个BLEU点(bilingual evaluation understudy,“双语评估替补”的缩写,是评估机器翻译文本的标准指标)。在中英文同声传译中,AI系统落后于中文语音大约三秒钟,翻译质量比全句(非同步)翻译低3.4个BLEU点。

STACL翻译系统发布当天,立即引起了国内外各大知名媒体的纷纷报道:

其中评价最高的是「IEEE Spectrum」,认为百度开发的这个新系统,揭示了一种通过预测未来而保持稳定的翻译工具,可以与联合国会议期间提供同传服务的口译人员相媲美,让人们离软件巴别鱼又近了一步(The Chinese tech giant Baidu has invented a translation system that brings us one step closer to a software Babel fish)。
「南华早报」评论:随着百度新的翻译系统亮相,百度向谷歌发起了挑战(Baidu to debut simultaneous machine translation in latest challenge to Google)。
「量子位」评论:百度宣布AI同传最新突破!能预测,低延时,演示效果惊人,外媒称媲美人类翻译。
「凤凰网」科技:媲美联合国同传,百度听清在2018百度世界大会的挑战。
「Fortune」:Baidu Looks to Amaze With A.I. Translation in Real Time(百度AI实时翻译效果惊人!)
「CNBC」:China’s Baidu challenges Google with A.I. that translates languages in real-time.
Silicon Angle的标题就更吓人了:Baidu creates the world’s first simultaneous translation system.

听起来是不是很厉害?当天甚至由于报道的知名媒体过多,百度于是直接在其Demo视频演示的GitHub页面上挂上了各大媒体的Logo:

于是在10月27日,也就是STACL系统发布的第三天,我也没忍住兴高采烈地在两个「翻译技术交流与资源共享」微信群中向近一千名翻译朋友果断做了推荐。毕竟连CNBC的报道里也提到的这次突破的重要原因,百度的预测功能是基于200万对中英语料库。

然而,好景不长,眼见他起高楼,眼见他楼又塌了。就在中外媒体纷纷对这一“技术突破”奔走相告一周而已的11月2日,语言服务行业的重要媒体「Slator」发布批评性报道,「The Art of Hyping Machine Translation」(机器翻译的炒作艺术),文章再次揭露百度的流氓与无耻本性:

Baidu is China’s top search engine, one of the country’s leading proponents of artificial intelligence, and an excellent study in public relations handiwork.(作为中国最大的搜索引擎,百度不仅是该国人工智能的主要倡导之一,更是公关艺术的优秀专家。)

百度PR部门将新闻稿、研究论文、以及GitHub演示页面打包发给了众多媒体机构(这其中就包括Slator)。几小时后,媒体报道铺天盖地:MIT Technology Review、Engadget、CNBC、SCMP、Fortune等等等等。

在Baidu Research的Github演示页面上甚至集中挂上了该论文获得的媒体报道链接和媒体Logo。虽然这些报道失实,但是由于是重要媒体站台,该报道得到了更多其他媒体的疯狂转载。

而作为PR的一部分,百度在11月1日的百度世界大会上进行了STACL的公开演示。大会期间,主显示屏两侧的两个屏幕分别显示了自动语音识别输出和STACL的即时翻译。

 

 

 

 

 

 

 

但是,现场直播中的同声传译仍然是由人工口译员提供。

关于STACL的翻译效果究竟如何?研究者分别做了英-德和中-英方向的任务实验。在wait-5-model模型(即系统等待5个单词后开始翻译)中,STACL的输出质量略差于炒作效果。而在wait-3-model模型(即系统等待3个单词后开始翻译)中,系统预测的词则是完全错误的。

Slator同样采访到了NMT(神经机器翻译)领域的专家,请求他们发表对于STACL系统的看法:

NMT领域的专家、Iconic Translation Machines的联合创始人和CEO John Tinsley表示:在判定每一项新研究是否为突破(breakthrough、即此次各大媒体在报道STACL时用到的词)时,我们仍需极其谨慎。

都柏林城市大学Andy Way教授则表示:如果这(STACL)不是支持口译人员的工具,而是打算要取代他们,那么我认为,根据我的经验,你该了解我会对此说些什么(“If this is not a tool to support interpreters, but instead is intended to replace them, then I think you know based on my track record what I would say about that.” )。

而System Global的CTO Jean Senellart博士则直接表示:这根本不是什么科学突破(“Not a Scientific Breakthrough”)。百度的公告不过制造了很多噪音(”the announcement made a lot of noise “)。

写到这里,我还能说些什么。我向来不惮以最坏的恶意来揣测百度,却不曾料到他们竟然无耻到了这个地步!


Reference:

Baidu Research Blog:research.baidu.com/Blog/index-view?id=107
官方Demo演示:https://simultrans-demo.github.io/
Paper地址:https://arxiv.org/abs/1810.08398