V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
westice
V2EX  ›  自然语言处理

cpu/gpu 高性能中英粤文本转语音 TTS

  •  
  •   westice · 2025 年 12 月 30 日 · 807 次点击

    基于 Melotts 训练的粤语 english 、普通话 english 混合 TTS 模型 推理端采用 onnx-golang,普通 4 核 cpu 转换 30 秒音频只需 2 秒,普通 GPU 只需 0.5 秒,模型大小 170M ,功能还在完善中...,欢迎提出建议。 https://github.com/westice007/XWX_tts

    3 条回复    2025-12-31 08:52:29 +08:00
    itechify
        1
    itechify  
    PRO
       2025 年 12 月 30 日
    建议搞个 web 前端
    itechify
        2
    itechify  
    PRO
       2025 年 12 月 30 日
    音色,语速,场景那些可以调整吗?
    westice
        3
    westice  
    OP
       2025 年 12 月 31 日
    和语音克隆不一样,提前提供音色然后训练对应的模型,一个模型可以对应多个音色,语速 speed 做为推理参数输入,场景支持还没有。
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   869 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 31ms · UTC 21:46 · PVG 05:46 · LAX 13:46 · JFK 16:46
    ♥ Do have faith in what you're doing.