微软宣布 VALL-E – 一种可以在 3 秒内训练的文本到语音 AI
人工智能现在会为声音艺术家而来吗?
微软研究人员开发了 VALL-E,这是一种文本到语音 (TTS) 生成器,可以在三秒内模仿任何语音。 VALL-E 是一种自然发声的语音发生器,不同于以前听起来像机器人的语音机器。 这可能不是最好的事情。
为史蒂芬霍金——世界上最伟大的思想家之一——提供声音的文字转语音机器已经取得了长足的进步。 这些服务,从阅读手机短信到阅读书页,随处可见。
来源和详细信息:
https://interestingengineering.com/innovation/microsoft-vall-e-text-to-speech