让电脑能听会说(下)_互动科普

使用社交账号登录

购买价格:
付款方式:

互动科普

主页 > 科普纵览 > 工程 • 技术

让电脑能听会说(下)

《科学世界》  发表于 2018年05月08日

机器翻译的准确性

科学世界:不同语言的翻译难度差别大不大?

:中译英和英译中绝对是不对称的。可是总的来说,我觉得两个的难度差不多。因为一个语言如果不是太原始,都要涵盖很多的概念,它们的复杂度其实最后平均下来是差不多的。

 

科学世界:目前机器翻译的准确性如何,如何衡量?

平:日常使用现在还可以,但是还不能做很复杂的翻译,比如古诗。

我个人认为,真正的翻译不是简单地从一句A语言翻译成另外一句B语言,尤其在文学上更是如此。虽然可能词汇相同、说法类似,可是不同语境下的言外之意会相差很多。翻译李白的诗,从古至今一直是很难的事情。

关于怎样去衡量机器翻译的准确性。像语音合成、机器翻译,最后打分或者品鉴的都是人。可是人也各不相同,每个人要求的结果和预期都不一样。这主要是要看你的应用标准,对日常使用和要达到“信、达、雅”的境界来说,要求就很不相同。

语音合成的衡量,也是找人来听的。例如英语的语调,如果不是母语为英语的人,可能感觉就不对。发音的正确性,当然也是母语的说话人来判断最好。但是这也不见得就一定准,比如找山东人来听普通话的四声的话,就不见得很准,而且很可能是错误的。

 

用你的声音说外语

科学世界:什么是跨语言的语音合成?

:一个人可能只会说英文。我们要让机器能够合成出他的语音,用他的声音说出中文。这时,我们需要参考一个说中文的人,这两个人很可能性别不同、说话的方式不同。怎么样把中文说话人与英文说话人的语料之间在发音构造,如声带、舌头等方面的差别都消除,又是一个异中求同的事。

经过我们跨语言的语音合成以后,用里克·雷斯特的英文训练出来的语音合成器说的中文,听起来就是用他的语音说出的非常标准的普通话。

 

科学世界:语音合成现在能做到什么样的效果?

:语音合成方面,我们有跨语种的应用。比如在北京用电脑或手机导航,地标是中文的,而一个英文的语音合成器是用只会说英文的人提供的语料训练的。我们希望用这个人的声音把中英文夹杂地说出来。总的来说,你可以听到从中文到英文之间几乎无缝的结合,感觉像是同样一个人说的。

现在中英文混说的情况越来越多,尤其是在科技界、商业领域或者大学里面。比如一般人不会说“微软的视窗系统”,一定是说“微软的Windows”。当今交通便利,互联网实现了信息的便捷交换,不同语言的相互渗透也越来越多。

20150608让电脑能听会说-下.jpg

图:一个跨语种表达的例子


 

未来的语音技术

科学世界:在口语考试中,电脑是否可能超过真人?

:这个很难讲。不过现在机器说的中文,找任何人来听,都不会认为这是外国人说的,因为几乎没有口音。让他读一首唐诗,可能比大部分人说的普通话都标准。所以它有可能超过真人,这就有很多可能的应用。

除了语言学习,机器学习还可以开发出很多个性化的应用。比如有人得了癌症,手术以后不能说话,那么手术以前可以把他的语音存储起来,手术后他就可以通过语音合成器与人交流。对于瘫痪的患者,他甚至可以通过眼神注视的方式来控制键盘,把自己的意思用语音表达出来。

 

科学世界:智能语音目前还有哪些关键的问题有待突破?

:有很多。例如目前电脑一个最大的问题就是“轻重不分”。比如从语音识别来讲,通常长的词不太容易认错,而介词像“of”、“in”、“on”、“at”这些,都比较容易认错,因为它们太短了。刚才讲到协同发音的问题,由于受到前面的词的影响,会使得说出的“of”这个词不像它原本的发音。这些“不太重要”的词,人都可以自动把它补全,但机器现在还做不到。它如果把“of”听成了“at”,那么很可能翻译的结果就完全是驴唇不对马嘴。

 

科学世界:这个问题有没有可能通过学习解决?

:通过学习都是有可能解决的,但是目前它要求得太细,我们还顾不到。

另外,虽然语音识别目前识别率还不错,可是在噪声比较大的环境里,或说在一个容易反射、有回声的环境里,识别还是很有问题的。还有,在语音合成方面,我们希望它能更多地有一些情感表达、抑扬顿挫,不论是念诗、吟唱、说相声都有恰当的表达。这些我们都还在继续努力当中。

这些问题都是很不容易的。在任何一点的突破,对于推进语音研究都很有帮助,而且一定非常令人振奋。未来几年智能语音可以达到什么样的水准,什么时候会产生突破也很难说,我们只能期待它不断进步。“为山九仞,功亏一篑”,所以不能停止,要努力往前推进。

 

科学世界:智能语音技术的“终极目标”是什么?

:终极目标就是通过图灵测试,即人分不出来说话的是真人还是机器。其实有些能力,比如听音辨位、翻译的能力,人的能力范围未必是机器的能力上限。比如一个人通常能够识别出的说话人的范围很小,很可能只有几十个人。如果有个很久没联系的人打电话给你,这时候你可能就认不出来了。可是在这点上机器比人强,因为它听过就不会忘记。机器的计算能力也特别强,它不怕计算。

 

科学世界:是不是智能语音技术足够强大了以后,人就没必要学外语了?

:有人说数学好的人,都会喜欢巴赫的音乐。巴赫的音乐,基本的内容很简单,但是变化无穷。语言也是类似的东西。你可以把学习外语当作一种兴趣、一种锻炼、甚至一种娱乐。学习一种新的东西,始终是很有趣的一件事。学习外语和学习新的工具其实没什么差别。当你去学习一个新的东西,你的思维、反应都会更灵敏一些。对学习者来说这是一种需要、兴趣和快乐。

我不认为这个世界会越来越平,大家还都是各说各话,会继续学习另外一种语言。因为语言对一个人来讲是开启另外一种文化宝藏的钥匙。不懂某种语言,就与这种文化隔得很远,即使有了机器翻译,还是隔得很远。


(本文发表于《科学世界》2015年第6期)



全部评论

你的评论