当前位置:首页 > 人工智能 > >

OpenAI亮相AI语音模型新技术!15秒录音档可生成多国语言合成人声

OpenAI亮相AI语音模型新技术!15秒录音档可生成多国语言合成人声
2024-03-31 22:48:51 来源:聚焦媒体网

继发布依据一段文字描述可自动生成60秒影片的“Sora”杀手级AI 模型后,OpenAI 日前首次公开旗下历经近2年开发的“Voice Engine”AI声音模型新技术并展示最新初步测试成果,诉求仅需上传录制一段15秒的真人音档样本,就能通过AI模型自动生成与该真人音档样本极为相似的AI合成语音,不但能听到与原始音档样本相近的口吻声调,并且还可生成不同的语言版本,包括:英文、西班牙文、中文、日本等多国语言。

OpenAI 表示,目前针对语音生成技术所开发的“Voice Engine”AI模型,初期现阶段仅向少部分约十人左右的开发者推出,尚未正式对公众开放使用。适合应用的情境像是:教学影片的旁白、或为影片提供多国语言翻译音档等。

为防范该语音AI模型遭不当滥用、散播不实资讯等资安风险(如假冒某某人的诈骗电话),将采取严格安全管控措施。OpenAI 指出,参与该AI模式测试计画人员,需取得当事人提供声音档样本的授权同意;此外,依据“Voice Engine”AI模型所生成的合成语音档案,必需明确标注是出自AI生成、非真人发声。另,OpenAI 也为“Voice Engine”AI模型所生成的语音合成档案,加入具浮水印防止篡改的安全机制。

关键词:

免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。

投诉邮箱:Email:133 46734 45@qq.com

相关新闻