Chat ttsAI语音项目-发布十天狂砍20K⭐️!

前言

🤔 最近GitHub上一个叫做Chattts的超酷项目非常火,短短十天就在GitHub上收获了20K的star,今天我们就来看看怎么样去使用它吧。

亮点

对话语音合成

ChatTTS 能支持多说话人互动对话,效果非常自然,像真人聊天一样。还能预测和控制语音中的笑声、停顿等细节,让语音更加生动。
在语调上,ChatTTS 真的超越了大多数开源的 TTS 模型,听起来更加自然和有表现力。

如何快速开始使用

在线体验

访问chattts.com即可进行在线操作体验。

本地部署

说实话非常不推荐在本地部署,因为太tm卡了 不过如果你想的话,可以通过以下步骤在本地安装和运行ChatTTS。

点击查看部署教程😁

步骤1:从GitHub下载代码

打开终端并运行以下命令来克隆ChatTTS代码库:

1
git clone https://github.com/2noise/ChatTTS

步骤2:安装依赖项

确保你已经安装了Python和pip。接着运行以下命令来安装必要的依赖项:

1
pip install torch ChatTTS

步骤3:导入所需的库

在你的Python脚本中导入必要的库:

1
2
3
import torch
import ChatTTS
from IPython.display import Audio

步骤4:初始化ChatTTS

创建一个ChatTTS类的实例并加载预训练的模型:

1
2
chat = ChatTTS.Chat()
chat.load_models()

步骤5:准备你的文本

定义你想要转换为语音的文本:

1
texts = ["Hello, welcome to ChatTTS!"]

步骤6:生成语音

使用infer方法从文本生成语音。设置use_decoder=True以启用解码器:

1
wavs = chat.infer(texts, use_decoder=True)

步骤7:播放音频

使用IPython.display中的Audio类播放生成的音频。将采样率设置为24,000 Hz并启用自动播放:

1
Audio(wavs[0], rate=24_000, autoplay=True)

本地、Docker部署API

这个方法来源于“https://github.com/ultrasev/ChatTTS ” , 支持docker一键部署成API,然后通过其他应用或者curl调用。

点击查看部署教程😁

FastAPI 服务本地部署和使用指南

本地部署

  1. 安装依赖:

    1
    pip3 install -r requirements.txt
  2. 启动服务:

    1
    uvicorn main:app --host "0.0.0.0" --port 8000

使用示例

发送 POST 请求,生成音频并保存到本地:

1
2
3
curl -X POST -H 'content-type: application/json' -d \
'{"text":"朋友你好啊,今天天气怎么样?", "output_path": "abc.wav", "seed":232}' \
http://localhost:8000/tts

参数说明:

  • text: 要转换的文本
  • output_path: 音频保存路径
  • seed: 音色种子,不同种子会产生不同音色,默认值为697

Docker 部署

运行 Docker 容器:

1
docker run -d --name chattts -p8000:8000 -v /tmp/audio:/audio ghcr.io/ultrasev/chattts:latest

注意:

  • /tmp/audio 为本地音频文件存储路径
  • /audio 为容器内音频文件存储路径

发送 POST 请求,生成音频并保存到 Docker 容器中:

1
2
3
curl -X POST -H 'content-type: application/json' -d \
'{"text":"朋友你好啊,今天天气怎么样?", "output_path": "/audio/abc.wav", "seed":232}' \
http://localhost:8000/tts

整合包打开即用

逛B站时发现了一个UP主嘟嘟实验室做的整合包,支持Win系统、Mac系统。

最后叨叨

如果上述的一些环节出现问题,可以选择询问ChatGPT来寻求帮助,或者直接使用在线演示网站。假设你不知道怎么使用GPT4,可以访问我的 AI导航网站

引用链接