逆天!OpenAI最近推出智能Voice Engine技术,仅需15秒音频样本即可克隆自己声音
当地时间3月29日,美国人工智能研究公司OpenAI在官网首次分享了名为“Voice Engine”(语音引擎)的预览。通过输入文本和15秒音频样本,Voice Engine便可以生成一个与音频中说话者非常相似的自然语音。这项技术能够生成“自然的语音”和“情感丰富且真实的声音”。
OpenAI称,公司在2022年底就启动了Voice Engine的研发工作,并将它用作一些其他功能的预设语音。由于合成语音可能会被滥用,公司只在小范围内与开发人员分享了该模型,未来可能不会广泛推出这一功能。
相较于传统的语音合成技术,Voice Engine的主要亮点包括其仅需极短的音频样本就能生成高质量的声音,以及其合成声音的自然度和情感丰富性。此外,这项技术还能应用于多种场景,如教育、多语言翻译、社区卫生服务、辅助通讯以及神经科学等领域。
这项技术的出现也引发了对声音信息安全和隐私保护的担忧。OpenAI承认存在被滥用的风险,特别是在选举年等敏感时期。为了应对这些风险,OpenAI已经采取了一系列措施,包括与政府、媒体、娱乐、教育等领域的合作伙伴进行深入交流,以确保在产品发布时能够将风险降至最低。所有预览测试人员都必须遵守OpenAI的使用政策,该政策明确禁止在未经同意或缺乏合法权利的情况下冒充他人。
此外,OpenAI还实施了一系列安全措施,包括使用水印技术追踪音频来源,以及对系统的使用方式进行主动监控。当产品正式推出时,公司将设立一个“禁止语音列表”,以检测并阻止与名人过于相似的人工智能生成声音。
Voice Engine技术的出现标志着语音合成领域的一大进步,但其带来的安全和隐私问题也不容忽视。OpenAI正在努力通过多种措施来减轻这些风险,并确保技术的负责任使用。未来将会广泛应用于音频行业,例如智能家居、智能音箱、智能汽车等等。
尧尧妈妈
校验提示文案
尧尧妈妈
校验提示文案