美国人工智能开发公司OpenAI再推强大的AI工具——语音AI“Voice Engine”(语音引擎),短短15秒的说话声音样本,就能复制真人的声音!
《纽约时报》、《美联社》等外媒报道,OpenAI的这项语言AI功很强大,15秒的时间,把一个音频样本复制出一个与音频中说话者非常相似的自然语音,而这个生成的自然语音,具有丰富的情感和逼真的声音。
而且,生成结果不受声音样本语种限制,若说的是英文,这项技术可使用你的声音,生成西班牙语、法语等其他语言结果。
不过,基于考量到存在滥用的风险,OpenAI现阶段仅供合作伙伴使用,没有对外开放。
外媒报道,OpenAI公司进军语音技术领域,在申请商标Voice Engine之后,分享测试成果,但考量到合成语音滥用的可能性,特别担忧这项技术可能被拿来破坏线上银行账户等的声纹认证(voice authenticator),因此,OpenAI现阶段对于更广泛的发布采取谨慎态度。
OpenAI指出,制造出类似人声的言论存在重大风险,特别今年是选举年,Voice Engine测试伙伴已经同意规范,例如向受众披露声音经AI生成、原始声音者必须明确知情同意。
除此之外,OpenAI也说明,公司有执行多项安全措施,包括使用数位浮水印来追踪所有Voice Engine生成音讯的源头,并针对其使用情况进行主动监控。
(新闻整理自《ETtoday新闻云》《新浪科技》)