通过微软Azure语音识别和TTS将语音转换为文本
TTS语音向导是一种工具,允许用户通过微软Azure语音识别和TTS将语音转换为文本,然后再转换回语音。它还向VRChat发送OSC消息以在头像上显示文本。该工具有许多自定义选项,包括100多种不同的声音,20多种支持的语言,并能够显示歌曲标题,艺术家和用户以上的进度。
全球热门的人工智能创作音乐和语音的产品
Google DeepMind推出了其最新的音乐生成模型Lyria
AI 音乐、文本转语音、语音转语音
可以轻松地将视频翻译成多种语言
Blogcast™是一个文本转语音的工具
一键音频噪音分离消除