MOSS-TTS-Nano 中文版

本地文本转语音演示,支持 CPU 运行、多语言生成,以及可选的音色克隆。

基于 MOSS-TTS-Nano 构建。

正在使用所选示例的提示音频。
生成参数
设为 0 表示保持当前默认行为。将最大 TTS 批大小设为 1,可强制拆分后的分块逐个执行。 缓冲生成会保持分块顺序,并将 codec 子批次限制在当前 TTS 批大小以内。 实时流式解码会保持输出顺序,并在自动批处理、最大 TTS 批大小和最大 Codec 批大小之间选择当前最小的有效分组宽度。
当前应用仅使用 CPU。CPU 线程数会映射到该次请求的 `torch.set_num_threads`。
WeTextProcessing 和 normalize_tts_text 现在可以在每次请求中分别独立开关。 WeTextProcessing 会在启动时预加载,因此启用后不会额外增加首次请求的图构建延迟。
Warmup complete. device=cpu elapsed=20.39s
WeTextProcessing disabled.
空闲。
播放时会在这里高亮当前句子。
默认使用模型默认音色进行纯文本合成。
当前浏览器还没有生成历史。
模型路径:/www/MOSS-TTS-Nano/weights/MOSS-TTS-Nano
音频 Tokenizer:/www/MOSS-TTS-Nano/weights/MOSS-Audio-Tokenizer-Nano