CoquiTTS使用笔记
Coqui TTS 使用笔记
Coqui TTS 是一个开源的、深度学习的文本转语音(Text-to-Speech, TTS)库,旨在提供高质量、自然且富有表现力的语音合成能力。它由 Coqui.ai 公司开发,被认为是新一代的开源语音合成标杆之一
模型路径
root/.local/share/tts/tts_models--en--ljspeech--tacotron2-DDC官方文档
https://docs.coqui.ai/en/latest/docker_images.html
Docker 常用命令
启动并进入容器(带 GPU 支持)
docker run --rm -it -p 5002:5002 --gpus all --entrypoint /bin/bash ghcr.io/coqui-ai/tts启动并进入容器(无 GPU)
docker run -it -p 40499:5002 --entrypoint /bin/bash ghcr.io/coqui-ai/tts模型操作
查看可用模型列表
python3 TTS/server/server.py --list_models启动 TTS 服务(使用特定模型)
python3 TTS/server/server.py --model_name tts_models/en/vctk/vits --use_cuda true示例:使用中文 Tacotron2 模型
python3 TTS/server/server.py --model_name tts_models/zh-CN/baker/tacotron2-DDC-GST启动后可通过浏览器访问 http://localhost:40499 使用服务。常见组件类对应的 CLSID
| 组件 | CLSID |
|---|---|
| 管理工具 | {D20EA4E1-3957-11d2-A40B-0C5020524153} |
| 公文包 | {85BBD92O-42A0-1O69-A2E4-08002B30309D} |
| 控制面板 | {21EC2O2O-3AEA-1O69-A2DD-08002b30309d} |
| 字体 | {D20EA4E1-3957-11d2-A40B-0C5020524152} |
| 历史记录 | {FF393560-C2A7-11CF-BFF4-444553540000} |
| 收件箱 | {00020D75-0000-0000-C000-000000000046} |
| Microsoft 网络 | {00028B00-0000-0000-C000-000000000046} |
| 我的电脑 | {20D04FE0-3AEA-1069-A2D8-08002B30309D} |
| 我的文档 | {450D8FBA-AD25-11D0-98A8-0800361B1103} |
| 网上邻居 | {1f4de370-d627-11d1-ba4f-00a0c91eedba} |
| 网络连接 | {7007ACC7-3202-11D1-AAD2-00805FC1270E} |
| 打印机和传真 | {2227A280-3AEA-1069-A2DE-08002B30309D} |
| 程序文件夹 | {7be9d83c-a729-4d97-b5a7-1b7313c39e0a} |
| 回收站 | {645FF040-5081-101B-9F08-00AA002F954E} |
| 扫描仪和照相机 | {E211B736-43FD-11D1-9EFB-0000F8757FCD} |
| 任务计划 | {D6277990-4C6A-11CF-8D87-00AA0060F5BF} |
| 开始菜单文件夹 | {48e7caab-b918-4e58-a94d-505519c795dc} |
| Internet 临时文件 | {7BD29E00-76C1-11CF-9DD0-00A0C9034933} |
| Web 文件夹 | {BDEADF00-C265-11d0-BCED-00A0C90AB50F} |
其他路径
C:\Program Files (x86)\MyDrivers\DriverGenius\app\pdfreader