在近日采访中,微软工程师Fil Alleva开口讲述了Skype Translator与知名星战角色C-3PO之间的联系,以及他们为了达成通用翻译而走过的漫长道路。尽管很多人角色探索星际的《Star Trek》更符合这一描述,但Alleva却指出,C-3PO应该能够理解和讲述百万种语言。正如最近即将上映的第7部《Star Wars》电影一样, Skype Translate团队的基础工作也花费了30多年,具体可以追溯到微软技术副总裁黄学东在1993年的一次演讲。
在携手黄与微软技术研究执行副总裁Harry Shum之后,Alleva开始了将这种有些书呆子气的科幻概念,搬进普通消费者现实生活的探索之路。
为了实现这一目标,该团队开始借助不断进步的计算机技术,比如机器学习、大量数据、以及人工智能。
当然,我们还面临计算能力和自然语音翻译等方面的障碍,比如在有回声或嘈杂的环境中,当前的语音识别技术和麦克风都还不给力。
此外,微软还承认,单方面采用语音识别的最大障碍,是那些‘难以理解的因素’,比如某些词语在语境中的含义。
在理解这些微妙的‘一词多义’上,机器显然会遇到麻烦。微软亚洲研究院负责人洪小文强调称:“这意味着你不仅要处理语音识别,还要解决自然语言、文本语音转换、行动规划与执行等方面的问题”。
洪小文表示,一旦这三个系统能够联合做到语音识别计算,就可以最终达成我们所追求的‘AI-complete’。
尽管洪小文对此持审慎乐观的态度,但是微软内部的其它科研工程人员都对语音识别的未来跨越充满乐观。微软研究院Arul Menezes机器翻译团队表示:
对主要语言和主要场景来说,语言的障碍将在四年内基本不存在。
随着Cortana缓慢分支到其它平台、各种应用状况的数据手收集、以及微软集合了百万TTS的TellMe工具的发展,语音识别的普及,或许真的只是一个时间的问题。
[编译自:WinBeta]
支付宝扫一扫
微信扫一扫
赏