微软日前推出了一款名为 NaturalSpeech2 的语音模型,该模型采用“潜在扩散”式设计,在零样本语音合成层面效果出众,微软宣称该模型提供了“商业级”的语音 / 歌唱解决方案,能够给予用户高质量、多样化的语音合成体验。
微软对 NaturalSpeech2 进行了一系列演示,展示了其在零样本情况下生成具有不同说话人身份、韵律和风格(如唱歌)的语音的能力。
▲ 图源 NaturalSpeech 2 论文
据悉,与传统的语音转文字(TTS)系统不同,微软的 NaturalSpeech2 使用“连续向量”取代“离散标记”来表示语音,从而生成更完整的语音片段,不会产生“缺乏感情”的“棒读(一字一顿地讲话)”现象。
▲ 图源 NaturalSpeech 2 论文
实验结果表明,NaturalSpeech2 在零样本条件下生成的语音与语音提示和真实语音的韵律近乎一致,并且在 LibriTTS 和 VCTK 测试集上的自然度(以 CMOS 为度量)与真人语音难以区分。
该项目的论文目前已经发布于 GitHub 中,感兴趣的IT之家小伙伴们可以点此访问。
免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。
投诉邮箱:Email:133 46734 45@qq.com英特尔推送 AMD Radeon RX Vega M 显卡驱动更新,基于 Windows 10 64 位,适用于英特尔 NUC 套件 NUC8i7HNK 和 NUC8i7H
除 Windows 之外,微软为开发者、硬件或软件提供商提供了一系列部署工具和验证工具,例如 DISM、WinPE、工厂 OS 等,其中包括一种
密码密钥(Passkey)愈趋盛行,不但更方便用户登录帐号,亦能较安全地保障其私隐。 谷歌上周宣布,将在11月1日推出Andro...
据 The Verge 报道,全球最大的商业图库 Getty Images 将与英伟达合作推出生成式 AI 工具,它的名字也很直白:Generative AI
微软为采用 AMD 处理器的 Surface Laptop 4 推出了 9 月固件更新,为用户带来充电稳定性和性能改进、安全补丁以及错误修复。
苹果于上周发布iOS 17 1 1更新,主要修复天气小工具、车用无线充电等Bug问题,看似微小的更新却被YouTube频道iAppleby...
微信 Mac 平台迎来了 3 8 1 正式版更新,适用于 macOS Sierra 10 12 及以上系统。 本次更新安装包文件详细信息如下: 微
微软今日推送了 Windows 11 22H2 9 月正式版补丁 KB5030219,版本号升至 Build 22621 2283,没有什么太重要的更新内容,微软只
近期微软 Edge 浏览器在争夺第二大浏览器的竞争中败给了苹果的 Safari 浏览器,但这并没有阻止微软继续为 Edge 浏览器增加新功能
微软今天面向 Canary 频道的 Windows Insider 项目成员,发布了 Win11 Build 25905预览版更新,并开放了 ISO 镜像下载。
Kaspersky卡巴斯基是俄罗斯开发的杀毒软件,杀毒能力有目共睹,但也有很多网友体验过它的卡顿问题,再加上国产免费杀软的...
苹果在9月推出iOS 17,然而,有一些iPhone用户抱怨自从升级后,手机就出现WiFi连线不稳定的问题,例如连线速度缓慢、容...
微软今天面向 Dev 频道的 Windows Insider 项目成员,发布了 Win11 Build 23481 预览版更新,其亮点之一是移除了集成的 Team
苹果在今天发布的新闻稿中,宣布在 iOS 17 系统中,为 Apple Cash 新增定期个人转账功能,用户可以向指定账号设置每周、周两周和
在推出传闻中的Windows 12之前,微软稍早发布下半年的Windows 11 23H2更新内容,主要针对先前推出的Copilot,以及今年9月推出的人工
英特尔上周为旗下锐炫显卡推出了 DirectX 11 驱动更新,为 PC 游戏玩家带来了更强劲性能,同时发布全新 PresentMon Beta 工具
微软更新了 SwiftKey 键盘输入法 Android 应用。版本号升级到 8 10 34 6,带来了一些新功能,并配备了新的表情符号和新的键盘主题
索尼推出了动捕系统 mocopi,VR 内容创作者仅需 6 个可穿戴传感器便可实现动作捕捉。该系统拥有 iOS 和安卓的配套程序,允许用户
LG OLED C3 系列电竞游戏电视近日开启预售,其中 42 英寸版本售价 9999 元、48 英寸版本售价 10999 元、55 英寸版本售价 1
苹果公司在今天召开的特别活动中,宣布将于 9 月 26 日正式发布 macOS Sonoma,用户可以打开设置->通用->软件更新...
苹果在本周正式推出iOS 17 1,此为iOS 17的首次大更新,除了带来AirDrop支持移动网络传输等新功能,也修复了9大Bug和15个安全漏洞,
微软正在为其 Edge 浏览器试验一项针对 PC 游戏玩家的新功能,被称为Edge for Gamers,微软在最近一次向 Edge 内部测试者推送
作为一款经典的简易绘图软件,微软 Windows 画图应用历经多个系统版本,在 Windows 11 中迎来了 UI 大变,然而画布一直只能显示
苹果公司近日面向 Win11 用户,通过 Microsoft Store 平台更新了 Apple Music、Apple TV 和 Apple Devices 三款预览版应用
Twitter 应用今日在苹果 App Store 已经更名为 X,这意味着该公司可能获得了苹果的特批,因为此前 App Store 明确规定应用名称
Proton 今年发布了许多更新和新的以隐私为中心的解决方案,包括家庭计划、端到端 Proton Pass 密码管理器等。现在,该公司为其 Pr
应用订阅服务提供商 Setapp 今天发布公告,宣布计划 2024 年推出适用于 iOS iPadOS 的第三方应用商城。 昨日报道,彭博社
上汽智己汽车宣布带来全新整车软件版本 IMOS 2 0。本次 OTA 将于今天(4 月 20 日)开启下发,分批推送将持续到 4 月 27 日。
美团 iOS 版最近推出了 12 8 402 正式版,带来了实时活动与灵动岛适配,外卖配送进度实时知晓。 美团外卖 App 已测试支持
据官网消息,Visual Studio Code 1 83 版本目前已经发布,主要改进了软件的可访问性,优化了命令搜索功能,并升级了 Python 调试
谷歌近日更新 Chrome 浏览器,Win10、Win11 以及 macOS 等平台用户通过访问 chrome: password-manager passwords地址,可以使用
微软在今年 6 月邀请 Canary 和 Dev 频道用户、在 7 月邀请 Beta 频道用户之后,今天面向所有 Win11 用户,开放画图应用的
开源装机工具 Ventoy 于近日发布了 1 0 91 版本更新,本次更新最值得关注的改进就是,可识别簇大小超过 64KB 的 NTFS 格式磁盘
摩托罗拉 edge s pro 手机获推 MYUI5 0 系统更新,基础版本为 S1RAA32 54-37-4,推送版本为 T1RAA33 39-11-2。 此次升级将
苹果 iOS 17 进一步增强了看图查询(Visual Look Up)功能,可以帮助用户在日常生活场景下,更轻松地识别照片中的物体。 用
经过好几个月的Beta测试后,三星日前终于向Galaxy S23系列推出基于Android 14系统的One UI 6更新。 其中一项全新的工具Auto Bloc
openEuler RISC-V 23 03 创新版本在近期正式发布。openEuler RISC-V SIG 作为 openEuler 系统在 RISC-V 架构上的维护组织,