当前位置:

首页 -软件定制 -TTS定制语音模型训练

外包开发,降低企业成本

TTS定制语音模型训练

  • 价格:
    电联
  • 发布公司:
    珠海横琴信软科技有限公司
  • 联系人:
    李怡
  • 联系电话:
    1370300****

珠海横琴信软科技有限公司

联系人:李怡    联系电话:1370300****
公司地址:珠海市横琴新区宝华路6号105室-24282(集中办公区)

信息详情

基于FastPitch+Bert模型从0到1训练出来的带有感情专属tts模型整个模型训练流程1.修改默认nemo的fastpitch模型,加上bert特征2.预处理需要训练的语音数据,视频分离出音频数据,转换为采样率22050的wav文件,通过其他模型切割为15秒内的文件3.通过阿里语音转文本模型对进行标注,将所有文件转换为nemo的训练集结构4.训练fastpitch模型,4090训练10小时音频数据集大概300epoch5.提取fastpitch训练结果,对预训练的HIFIGAN模型进行微调,大概训练300epoch6.编写合成语音脚本,生成结果,具体结果看附件,训练合成结果试听http://file.finelink.ltd/dev/demo.wav
TTS定制语音模型训练
TTS定制语音模型训练
1.95G 4G 4G 4G 4G 4G 4G 4G 4G 6.298G 5552.86MB 6097.91MB 3.8G 3.04G 3.51G 4.49G 4.6G 3.31G 2.62G 3.1G 3.05G 4.51G 4G 3.85G 2.56G 3.03G 3.72G 4G 2.3G 3.8G 3.7G 4.36G 2.71G 5.17G 6.34G 2.92G 4.05G 6.34G