ChatTTS – 文本转语音模型

本文共计321个字,预计阅读时长2分钟。

一、程序介绍

ChatTTS是专门为对话场景设计的文本转语音模型。它支持英文中文两种语言。最大的模型使用了10万小时以上的中英文数据进行训练。在HuggingFace中开源的版本为4万小时训练且未SFT的版本.

二、程序界面

图片[1] - ChatTTS – 文本转语音模型 - 北牧日记

三、特点

  • 对话式 TTS: ChatTTS针对对话式任务进行了优化,实现了自然流畅的语音合成,同时支持多说话人。
  • 细粒度控制: 该模型能够预测和控制细粒度的韵律特征,包括笑声、停顿和插入词等。
  • 更好的韵律: ChatTTS在韵律方面超越了大部分开源TTS模型。同时提供预训练模型,支持进一步的研究。
  • 还可以添加提示词:口语化 [oral]、 笑声 [laugh]、停顿 [break],合理使用会很自然!

四、下载方式

温馨提示:最后更新于2024-06-15 00:39:06,某些文章具有时效性,若有错误或已失效,请评论反馈。
© 版权声明
THE END
喜欢就支持一下吧
点赞0赞赏 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容