百度无耻的岂止搜索引擎
读完方可成老师写的「搜索引擎已死」,勾起了一点关于百度往事的回忆。有感而发。 百度于 10 月 24 日公布了自己研发的 STACL 系统( Simultaneous Translation with Anticipation and Controllable Latency ,带有预测和可控延迟的即时翻译),据称能在译者开始讲话后几秒钟,而不是说完一段话后,就开始进行几乎同步的翻译。 如名称所示,上面讲到的「几秒钟」实际上是一个可控制的时长。当你需要在两种关联性相对较强的语言间互译时(比如说法语和西班牙语), STACL 差不多能做到隔开一个词就开始翻译。而当两种被译语言差距很大时(比如中文和英文),系统在翻译前要等待的时间就可能会久一些,只有这样才能保证更好的准确性。 百度官方发布的关于 STACL 系统的博客公告里提到 STACL 系统的重大技术突破: We tackled this challenge using an idea inspired by human simultaneous interpreters, who routinely anticipate or predict materials that the speaker is about to cover in a few seconds into the future. However, different from human interpreters, our model does not predict the source language words in the speaker’s speech but instead directly predict the target language words in the translation ( 我们受人类同声传译启发并采用这一想法来应对挑战,他们经常预知或预测说话者在接下来的几秒中讲的材料。 然而,与人类口译员不同,我们的模型并不预测说话者的源语言词汇,而是直接预测翻译中的目标语言词汇。 ) . 以下是百度解释的方式: “wait-k” ,即总是翻译说话者语音后面的 k 个单词以允许预测上下文。系统经过训练,使用源句子的可用前缀来决定翻译中的下一个单词。 在例子 Bùshí Z...