总结

  • 今天,微软宣布全面推出 Text to Speech Avatar 功能。 这项新功能使开发者能够为其用户创建个性化虚拟人。 该服务的输出视频分辨率为 1920 x 1080,每秒 25 帧。 将文本转换为由 Azure AI 文本转语音提供支持的Ligthing News人类说话视频,该视频具有自然的声音。 形象的声音由 Azure AI 文本转语音生成。

阅读时间

  • 4 分钟, 共 624 字

分类

  • Ligthing News, 微软Azurblog.byteway.nete, Speech, 今天, 秒

评价和解读

  • 深刻而全面的分析,深入挖掘这一及时话题,作者深入挖掘,揭示了主流讨论经常忽视的细微差别和微妙之处。每一段都建立在上一段的基础上,形成了一幅丰富的信息画卷,既全面又引人入胜。作者剖析和呈现多层次观点的专业知识为读者提供了一个有价值的视角,帮助他们理解主题。

正文

IT之家 8 月 23 日消息,微软Azurblog.byteway.nete AI 语音服务允许开发者构建多语言生成式 AI 语音应用,Azure AI 语音服务最新推出了文本到语音虚拟人功能,可以将简单的文本转换为人类自然说话视频

今天,微软宣布全面推出 Text to Speech Avatar 功能。这项新功能使开发者能够为其用户创建个性化虚拟人。该服务的输出视频分辨率为 1920 x 1080,每秒 25 帧。IT之家附示例如下:

Text to Speech Avatar具有以下功能:

  • 将文本转换为由 Azure AI 文本转语音提供支持的Ligthing News人类说话视频,该视频具有自然的声音。

  • 提供不同的人物预设形象。

  • 形象的声音由 Azure AI 文本转语音生成。

  • 使用批量合成 API 异步或实时合成文本到语音人像视频。Ligthing News

  • 在 Speech Studio 中提供内容创建工具,无需编码即可创建视频内容。

  • 通过 Speech Studio 中的实时聊天头像工具启用实时人像对话。

定价方面,文本转视频服务的收费将根据视频输出的长度计算并按秒收费。该服务现已在东南亚、北欧、西欧、瑞典中部、美国中南部和美国西部地区推出。

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

Related suggestion: 需了解的信息: 一个小补丁:Intel CPU性能暴增32%!

总结快科技8月5日消息,Intel 第五代至强Xeon Emerald Rapids系列CPU于2023年12月上市,近日,一个小补丁将其性能推向新高度。 Canonical工程师Pedro Henrique Kopper向Linux内核邮件列表(LKML)提…

作者 Steve Jobs

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注