Coqui TTS 使用笔记

Coqui TTS 是一个开源的、深度学习的文本转语音(Text-to-Speech, TTS)库,旨在提供高质量、自然且富有表现力的语音合成能力。它由 Coqui.ai 公司开发,被认为是新一代的开源语音合成标杆之一

模型路径

root/.local/share/tts/tts_models--en--ljspeech--tacotron2-DDC

官方文档

https://docs.coqui.ai/en/latest/docker_images.html


Docker 常用命令

启动并进入容器(带 GPU 支持)

docker run --rm -it -p 5002:5002 --gpus all --entrypoint /bin/bash ghcr.io/coqui-ai/tts

启动并进入容器(无 GPU)

docker run -it -p 40499:5002 --entrypoint /bin/bash ghcr.io/coqui-ai/tts

模型操作

查看可用模型列表

python3 TTS/server/server.py --list_models

启动 TTS 服务(使用特定模型)

python3 TTS/server/server.py --model_name tts_models/en/vctk/vits --use_cuda true

示例:使用中文 Tacotron2 模型

python3 TTS/server/server.py --model_name tts_models/zh-CN/baker/tacotron2-DDC-GST
启动后可通过浏览器访问 http://localhost:40499 使用服务。

常见组件类对应的 CLSID

组件CLSID
管理工具{D20EA4E1-3957-11d2-A40B-0C5020524153}
公文包{85BBD92O-42A0-1O69-A2E4-08002B30309D}
控制面板{21EC2O2O-3AEA-1O69-A2DD-08002b30309d}
字体{D20EA4E1-3957-11d2-A40B-0C5020524152}
历史记录{FF393560-C2A7-11CF-BFF4-444553540000}
收件箱{00020D75-0000-0000-C000-000000000046}
Microsoft 网络{00028B00-0000-0000-C000-000000000046}
我的电脑{20D04FE0-3AEA-1069-A2D8-08002B30309D}
我的文档{450D8FBA-AD25-11D0-98A8-0800361B1103}
网上邻居{1f4de370-d627-11d1-ba4f-00a0c91eedba}
网络连接{7007ACC7-3202-11D1-AAD2-00805FC1270E}
打印机和传真{2227A280-3AEA-1069-A2DE-08002B30309D}
程序文件夹{7be9d83c-a729-4d97-b5a7-1b7313c39e0a}
回收站{645FF040-5081-101B-9F08-00AA002F954E}
扫描仪和照相机{E211B736-43FD-11D1-9EFB-0000F8757FCD}
任务计划{D6277990-4C6A-11CF-8D87-00AA0060F5BF}
开始菜单文件夹{48e7caab-b918-4e58-a94d-505519c795dc}
Internet 临时文件{7BD29E00-76C1-11CF-9DD0-00A0C9034933}
Web 文件夹{BDEADF00-C265-11d0-BCED-00A0C90AB50F}

其他路径

C:\Program Files (x86)\MyDrivers\DriverGenius\app\pdfreader

标签: none

添加新评论