explore
explore
Published on 2025-03-15 / 54 Visits
1
0

F5-TTS声音克隆-ComfyUI版

F5-TTS可以通过一段声音克隆音色,然后朗读各种文字,创建界面十分麻烦,就使用Comffyui创建了一个工作流

工作流使用我自己写的达摩语音转文字节点,克隆使用F5-TTS节点,可以使用任意音频克隆声音。

F5-TTS再某些显卡上不会出声音,我修改了F5-TTS的代码,同时增加了多音字支持,节点为

https://github.com/boxzooai/ComfyUI-F5-TTS-Two

音频使用前应该裁剪到15s以内,也可以使用视频输入


Comment