“人机耦合”变成“人机大战” 折射人工智能领域整体浮躁—新闻

作者：高雅丽辛雨来源：科学网 www.sciencenet.cn 发布时间：2018/9/22 11:19:46

选择字号：小中大

“人机耦合”变成“人机大战” 折射人工智能领域整体浮躁

9月21日，一篇指责科大讯飞“AI同传造假”的文章引发了社会广泛关注，文中知乎用户、同传译员Bell Wang表示，日前举行的2018创新与新兴产业发展国际会议上，科大讯飞在现场和直播中展示的“AI同传”，用的其实是自己现场同传翻译的内容。

当晚，科大讯飞在电话会议回应中称：应主办方要求提供语音识别技术，直接转写译员翻译结果在会场大屏呈现，主办方同时要求在直播中合成识别结果，展示最新语音合成技术。

早在2017年，“科大讯飞翻译机让同传下岗”的文章刷爆各大平台，表示同声传译职业将直接消亡、被科大讯飞机器翻译技术完全替代。这次的事件再一次引发热烈讨论：机器翻译技术与同声传译之间到底还有多少差距？

事件回溯与科大讯飞回应

9月20日，Bell Wang发表文章称“要揭露一下所谓智能翻译的真相”，他表示在知领直播平台的“机器同传”，就是把同传译员的声音精确转录为文本，然后再语音合成为机器声音向听众播放。

文章称，“科大讯飞事前没有告知有语音识别的字幕，没有告知直播的同传是机器朗读同传经过识别出来的文稿，更没有征得同意就冒名使用了译员翻译成果”。

他的文章发出后，同传圈也“炸了锅”。微博名为“同声翻译樱桃羊”表示：“现在这种所谓的‘人机耦合’，实行之前和译员沟通过么？有没有调查过译员接受这种方式？纵观整件事，译员的意见在哪一个环节得到了尊重”？

当晚，针对Bell Wang的质疑，科大讯飞回应称：“科大讯飞目前翻译服务主要提供两种方案：一种是全自动翻译，现场机器翻译并同步展示在屏幕上，没有任何人工同传参与；另一种是人机耦合翻译模式，由机器提供语音转写和翻译结果给同传参考。”

机器同时提供转写和翻译服务时，文字展示区Logo显示为“讯飞听见—离线翻译系统”；机器仅提供转写服务时，文字展示区Logo显示为“讯飞听见”。

科大讯飞表示，“某位同传译员对于科大讯飞产生了误解，是对会议服务方面的分工沟通了解不清，也没有听到科大讯飞的说明”。

针对科大讯飞的回应，《中国科学报》记者联系了Bell Wang，但他表示不能接受采访。对科大讯飞提到的“应主办方要求展示最新语音合成技术”，他回应道“只能无可奉告，我不能说啥”。

同时记者注意到，Bell Wang在知乎上的文章在9月21日晚上有修改痕迹，他在开头声明：对视频进行了修改。

机器翻译能否替代同传译员？

来自科大讯飞微信公众号的内容显示，目前机器翻译的主流方式叫“统计翻译”，其基本原理是：从语料库大量的翻译实例中自动学习翻译知识，然后利用这些翻译知识自动翻译其他句子。

那么随着机器翻译技术的进步，不少人会发出疑问：机器会抢同声传译的饭碗吗？

科大讯飞创始人、董事长刘庆峰表示：“我们希望用机器帮助顶尖同传更好的发展他的能力，机器和人未来必须是协同的。”

一位不愿具名的专家告诉记者：“讯飞的技术在国内语音行业积累较多，但目前的情况是，人工智能只是处在初级阶段，机器翻译的难点在于语音识别和语义识别。在语义识别上，现在全球做的都不是太好。”

“目前机器在字、词的识别速度上是快于人的，但人在语意理解和提炼上又优于机器。因此，各取所长，优势互补的人机耦合是一个重要发展方向。”一位讯飞听见工作人员在接受其他媒体采访时说。

9月21日记者曾联系科大讯飞执行总裁、消费者事业群总裁胡郁，他表示“要找市场部和公关部，本人不作回应”。但当天下午胡郁在微博发声：“目前整个行业机器同传处于风口浪尖之上，不同厂商之间的竞争日加激烈，主要原因还是动了谁的奶酪吧。”

上述不具名的专家认为，网络媒体对人工智能存在过度宣传和炒作。“受到利益驱使，一些企业也利用媒体进行宣传，同时网络媒体也不会对内容和信息准确性进行核实，就造成了目前的状况。”

胡郁在今天凌晨的微博中说：“我相信大家也都知道科大讯飞真正的机器同传和将同传人员的语音转换成文字贴出来便于大家理解是两个完全不同的事情。不管是前者还是后者，都经过了广大最终用户和同传从业人员的检验，我就不再多说了。”

专家表示AI同传还不是一项成熟技术

自1989年美国成功做出第一个语音翻译系统以来，众多科研机构和包括微软、百度在内的公司都在进行AI翻译的研究。得益于人工神经网络的深入研究，这些年，AI同传技术发展很快。

“但是，这仍然不是一项成熟的技术，AI同传仍然有很多技术难题需要攻克。”中国科学院自动化研究所研究员宗成庆告诉《中国科学报》记者。

就目前AI同传技术水平而言，在某些简单的场景中，可以实现较准确的语言同步翻译，如问路。但是，在复杂、专业、严谨的场景中，AI无法实现精准翻译，做到“信”“达”“雅”。

出于语言本身的特点，词汇有多重含义，且经常出现有歧义、似是而非的语句。其次，口语的规范性不高，有很多省略、颠倒句式。此外，说话人的口音、语速、多种语言混合，场景其它声源的干扰，也会让AI同传“不知所措”。

“但最重要的一点是，机器无法精准把握说话人的意图。对语义的理解不够，是目前AI同传尚未解决的一大难题。因此，目前AI同传无法高水平地替代人工翻译。”宗成庆说。

宗成庆介绍，语音转文字技术主要的难点是同音字、词的处理，不同的字、词有相同的发音，需要结合上下文进行判断，如“保鲜”和“保先”、“反攻”和“返工”。

由于语音识别技术不需要太多的语言理解，在声源干扰不强烈的情况下，较标准的语音，可以转换成准确率较高文本。“这比AI同传成熟得多、容易得多。”宗成庆表示。（记者赵广立对本文亦有贡献）

以下评论只代表网友个人观点，不代表科学网观点。

�� SSI �ļ�ʱ��

编辑部推荐博文
研究生学位论文初稿提交导师前的十大注意事项 Photonics 2025 Travel Award申请通道已开启！花似“拖鞋”的兰花，常见兜兰类型介绍！那个18岁发AFM的天才今天发Science啦！神秘的火浣布之谜在高度连接的网络里，圈一定存在更多>>