作者:许悦 来源:中国科学报 发布时间:2023/8/3 15:17:12
选择字号:
人声、AI声傻傻分不清?
当心陷入深度伪造语音陷阱

 

如今,人工智能(AI)合成语音经常出现在抖音短视频或有声读物中,大部分让人感觉“一耳假”。

但是,近日一项发表于《公共科学图书馆-综合》的研究指出,面对AI深度伪造的语音,即使知道可能在听AI生成语音,讲英语和普通话的人仍然很难准确地辨识出来。这意味着,使用世界上最常用语言的数十亿人,正面临深度伪造语音骗局或接收到错误信息的风险。

在该研究中,英国伦敦大学学院的Kimberly Mai和同事让500多名参与者,挑战在多个音频片段中识别出AI深度伪造的语音。其中一些片段为女性讲英语或普通话通用句的真实声音,而另一些片段是利用女性声音训练的AI创建的深度伪造语音。

研究参与者被随机分配到两个实验组中。其中一组听20个母语语音样本,并判断真假,参与者分辨出人声和AI合成语音的准确率约为70%。这表明,人类在现实生活中对深度伪造语音的辨识能力可能会更糟一些,因为大多数人不一定事先知道他们可能在听AI生成的语音。

另一组参与者听20对随机选择的音频。每一对音频所述内容一致,不过分别是真实人声和AI伪造的语音录制的,参与者需要辨识出伪造的那一个。这次,准确率提高到了85%以上。不过研究团队表示,这种情况下的测试,给听者带来了实际生活中不存在的优势。

“这种实验设置的场景不能完全代表现实生活中的场景。”Mai说,因为现实生活中听众不会被事先告知他们所听的内容可能是AI伪造的。此外,说话者的性别、年龄等因素可能也会对真伪的识别产生影响。

美国加利福尼亚大学伯克利分校的Hany Farid说,在现实生活中,识别特定声音厄真实性很重要,因为骗子可能通过模仿领导的声音诱骗员工转账,或者将深度伪造的知名政客语音在社交媒体传播错误信息等。该研究为深度伪造语音自动检测系统的构建设立了一个有用的基线。

相关论文信息:https://doi.org/10.1371/journal.pone.0285333

 
版权声明:凡本网注明“来源:中国科学报、科学网、科学新闻杂志”的所有作品,网站转载,请在正文上方注明来源和作者,且不得对内容作实质性改动;微信公众号、头条号等新媒体平台,转载请联系授权。邮箱:shouquan@stimes.cn。
 
 打印  发E-mail给: 
    
 
相关新闻 相关论文

图片新闻
银河系发现巨大黑洞 史上最亮伽马射线暴来自一颗坍缩的恒星
中国天眼揭秘宇宙“随机烟花” 导师:年年审毕业论文,总有这些问题!
>>更多
 
一周新闻排行
 
编辑部推荐博文