最新活动:电脑PC端+手机端+微网站+自适应网页多模板选择-建站388元起价!!!
当前位置:主页 > 互联网资讯 > 微软发布AI声音生成工具 VALL-E:可模仿人说话I

微软发布AI声音生成工具 VALL-E:可模仿人说话I

时间:2023-05-16 08:05:16 阅读: 文章分类: 互联网资讯 作者: 网站技术员

导读:IT资讯IT资讯周四,微软研究人员宣布了一种名为VALL-E的新文本到语音 AI 模型,在给定三秒钟的音频样本时,它可以准确地模拟人的声音。一旦它学会了一种特定的声音,VALLito导电玻璃知识itp知识问答。

ito导电玻璃知识itp知识问答

周四,微软研究人员宣布了一种名为VALL-E的新文本到语音 AI 模型,在给定三秒钟的音频样本时,它可以准确地模拟人的声音。一旦它学会了一种特定的声音,VALL-E 就可以合成那个人说任何话的音频——并以一种试图保持说话者情绪基调的方式进行合成。

微软将 VALL-E 称为“神经编解码器语言模型”,它建立在Meta 于 2022 年 10 月宣布的名为 EnCodec 的技术之上。与通常通过操纵波形合成语音的其他文本转语音方法不同,VALL-E 生成来自文本和声音提示的离散音频编解码器代码。它基本上分析了一个人的声音,借助 EnCodec 将该信息分解为离散的组件(称为“令牌”),并使用训练数据来匹配它“知道”的内容,如果它说出三个之外的其他短语,该声音将如何发声- 第二个样本。

  • VALL-E官网:https://valle-demo.github.io/

微软发布AI声音生成工具 VALL-E:可模仿人说话

微软在一个名为Li网站seo优化软件briLight的由 Meta 组装的音频库上训练了 VALL-E 的语音合成能力。它包含来自 7000 多名演讲者的 60000公司网站建设 小时英语演讲,大部分来自LibriVox公共领域有声读物。为了使 VALL-E 产生良好的结果,三秒样本中的语音必须与训练数据中的语音非常匹配。微软 AR/VR 重要团队整体被解雇:放弃进军元宇宙?

在 VALL-E示例网站上,Microsoft 提供了数十个 AI 模型的音频示例。样本中,“Speaker Prompt”是提供给VALL-E必须模仿的三秒音频。“Ground Truth”是同一位说话者说出特定短语的预先存在的录音,用于做对比。“B网站建设公司aseline”是传统的文本到语音合成方法提供的合成示例,“VALL-E”示例是VALL-E模型的输出。

微软发布AI声音生成工具 VALL-E:可模仿人说话

也许是由于 VALL-E 可能助长恶作剧和欺骗的行为,微软没有提供 VALL-E 代码供其他人试验,因此我们目前还无法自行测试 VALL-E 的能力。

微软Phone Link让iPhone用户也能在PC电脑上使用iMessage相关ito导电玻璃知识itp知识问答。

关键词标签: AI 资讯 人说

声明: 本文由我的SEOUC技术文章主页发布于:2023-05-16 ,文章微软发布AI声音生成工具 VALL-E:可模仿人说话I主要讲述资讯,人说,AI网站建设源码以及服务器配置搭建相关技术文章。转载请保留链接: https://www.seouc.com/article/news_1195.html

我的IDC 网站建设技术SEOUC.COM
专注网站建设,SEO优化,小程序设计制作搭建开发定制网站等,数千家网站定制开发案例,网站推广技术服务。
  • 5000+合作客服
  • 8年从业经验
  • 150+覆盖行业
  • 最新热门源码技术文章