Chat ttsAI语音项目-发布十天狂砍20K⭐️!
JonasTech前言
🤔 最近GitHub上一个叫做Chattts的超酷项目非常火,短短十天就在GitHub上收获了20K的star,今天我们就来看看怎么样去使用它吧。
亮点
对话语音合成
ChatTTS 能支持多说话人互动对话,效果非常自然,像真人聊天一样。还能预测和控制语音中的笑声、停顿等细节,让语音更加生动。
在语调上,ChatTTS 真的超越了大多数开源的 TTS 模型,听起来更加自然和有表现力。
如何快速开始使用
在线体验
访问chattts.com即可进行在线操作体验。
本地部署
说实话非常不推荐在本地部署,因为太tm卡了 不过如果你想的话,可以通过以下步骤在本地安装和运行ChatTTS。
点击查看部署教程😁
步骤1:从GitHub下载代码
打开终端并运行以下命令来克隆ChatTTS代码库:
1 | git clone https://github.com/2noise/ChatTTS |
步骤2:安装依赖项
确保你已经安装了Python和pip。接着运行以下命令来安装必要的依赖项:
1 | pip install torch ChatTTS |
步骤3:导入所需的库
在你的Python脚本中导入必要的库:
1 | import torch |
步骤4:初始化ChatTTS
创建一个ChatTTS类的实例并加载预训练的模型:
1 | chat = ChatTTS.Chat() |
步骤5:准备你的文本
定义你想要转换为语音的文本:
1 | texts = ["Hello, welcome to ChatTTS!"] |
步骤6:生成语音
使用infer方法从文本生成语音。设置use_decoder=True以启用解码器:
1 | wavs = chat.infer(texts, use_decoder=True) |
步骤7:播放音频
使用IPython.display中的Audio类播放生成的音频。将采样率设置为24,000 Hz并启用自动播放:
1 | Audio(wavs[0], rate=24_000, autoplay=True) |
本地、Docker部署API
这个方法来源于“https://github.com/ultrasev/ChatTTS ” , 支持docker一键部署成API,然后通过其他应用或者curl调用。
点击查看部署教程😁
FastAPI 服务本地部署和使用指南
本地部署
安装依赖:
1
pip3 install -r requirements.txt
启动服务:
1
uvicorn main:app --host "0.0.0.0" --port 8000
使用示例
发送 POST 请求,生成音频并保存到本地:
1 | curl -X POST -H 'content-type: application/json' -d \ |
参数说明:
text
: 要转换的文本output_path
: 音频保存路径seed
: 音色种子,不同种子会产生不同音色,默认值为697
Docker 部署
运行 Docker 容器:
1 | docker run -d --name chattts -p8000:8000 -v /tmp/audio:/audio ghcr.io/ultrasev/chattts:latest |
注意:
/tmp/audio
为本地音频文件存储路径/audio
为容器内音频文件存储路径
发送 POST 请求,生成音频并保存到 Docker 容器中:
1 | curl -X POST -H 'content-type: application/json' -d \ |
整合包打开即用
逛B站时发现了一个UP主嘟嘟实验室做的整合包,支持Win系统、Mac系统。
最后叨叨
如果上述的一些环节出现问题,可以选择询问ChatGPT来寻求帮助,或者直接使用在线演示网站。假设你不知道怎么使用GPT4,可以访问我的 AI导航网站。