腾讯云语音合成工具

这是一个使用腾讯云 TTS（文本转语音）服务的应用程序，可以将文本转换为多种格式的音频文件。项目提供了图形用户界面(GUI)和命令行工具两种使用方式。

功能特点

使用腾讯云 TTS API 进行高质量语音合成
支持多种音色选择（通过图形界面直观选择或通过音色ID指定）
自动将长文本分段处理，保持语句完整性
支持多种输出格式（WAV, MP3, AAC, M4A, OGG, FLAC等）
可指定输出路径和文件名
图形界面支持音色试听和播放合成后的语音
提供语速、音量等参数调整

安装和设置

前提条件

Python 3.6 或更高版本
FFmpeg（用于音频处理）
- 官方下载地址：https://ffmpeg.org/download.html
腾讯云账号及 TTS 服务的访问凭证
- 注册腾讯云账号：
  1. 访问腾讯云官网并点击右上角的"注册"按钮
  2. 按照指引完成账号注册和实名认证
- 开通腾讯云 TTS 服务：
  1. 登录腾讯云控制台
  2. 在搜索栏中搜索"语音合成"或直接访问语音合成控制台
  3. 按照提示开通服务（新用户通常有免费额度）
  4. 当然，其实你可以直接在线合成，还可以听听不同音色的差别:在线合成.这个项目只是众多流程的一个小步骤所以我用脚本合成比较方便。
- 获取访问凭证（SecretId 和 SecretKey）：
  1. 访问 API密钥管理
  2. 点击"新建密钥"按钮创建一对新的SecretId和SecretKey，或使用已有的密钥
  3. 将获取到的SecretId和SecretKey保存好，用于后续配置
- 查看服务配额和计费信息：
  1. 在语音合成控制台可查看当前的用量和剩余免费额度
  2. 了解计费规则，避免产生意外费用

安装步骤

克隆或下载本项目到本地
安装所需的Python依赖：
```
pip install -r requirements.txt
```
确保FFmpeg已安装并可在系统路径中找到，或将其放置在项目的Softwares/ffmpeg/目录下
在Config目录下创建腾讯云凭证文件：
- 创建tencent_cloud_secret_key.csv文件，包含您的SecretId和SecretKey
- 创建tencent_cloud_voice_type.csv文件，包含音色ID和对应的名称（可选）
CSV文件格式示例：
```
SecretId,SecretKey
your_secret_id,your_secret_key
```

使用方法

图形界面（推荐）

启动图形界面：
```
python tts_gui.py
```
界面如下：
界面功能：
- 音色选择：左侧分类显示所有可用音色，点击选择需要的音色
- 搜索过滤：通过搜索框、场景、性别和类型过滤器快速找到所需音色
- 试听功能：鼠标悬停在音色头像上可显示播放按钮，点击试听该音色的示例音频
- 文本输入：在右侧文本框输入需要合成的文本
- 参数调整：调节语速和音量滑块设置合成参数
- 合成控制：点击"合成语音"按钮开始合成，合成完成后会自动播放
- 播放控制：使用进度条和播放/暂停按钮控制音频播放
- 文件管理：点击文件夹图标可打开音频保存目录
- 声音克隆：声音克隆功能正在开发中（Beta）
合成的音频文件将自动保存在项目根目录的Audios文件夹中，文件名格式为"音色名称_时间戳.wav"

命令行工具

python audio_generator.py -f <文本文件路径> [-o <输出文件路径>] [-v <音色ID>]

参数说明

-f, --file: 必需参数，指定要转换为语音的文本文件路径
-o, --output: 可选参数，指定输出文件的完整路径和格式（通过文件后缀决定格式，如：output.mp3）。如果不指定，将在输入文件的同一目录下生成同名但后缀为.wav的音频文件
-v, --voice: 可选参数，指定腾讯云的音色ID，默认为101011，音色ID和对应的角色可查看config/tencent_cloud_voice_type.csv,也可以在线试听

支持的输出格式

WAV (默认格式)
MP3
AAC/M4A
OGG
FLAC
其他FFmpeg支持的格式

示例

基本使用（默认在输入文件同目录下输出同名.wav文件）：
```
python audio_generator.py -f Text/my_text.txt
```
这将生成 Text/my_text.wav 文件

指定输出为MP3格式：

python audio_generator.py -f Text/my_text.txt -o myaudio.mp3

指定完整输出路径和格式：

python audio_generator.py -f Text/my_text.txt -o C:/Users/MyName/Desktop/output.aac

指定不同的音色：

python audio_generator.py -f Text/my_text.txt -v 101016

项目结构

TecentCloud_Audio_generator\
├── audio_generator.py      # 命令行工具主程序
├── tts_gui.py              # 图形界面主程序
├── Config\                 # 配置文件目录
│   ├── tencent_cloud_secret_key.csv  # API密钥配置
│   └── tencent_cloud_voice_type.csv  # 音色信息配置
├── Resources\              # GUI资源文件（图标等）
├── AudioResources\         # 音色示例音频目录
│   ├── 标准音色\
│   ├── 大模型音色\
│   └── 精品音色\
├── Audios\                 # 合成音频输出目录
└── Softwares\              # 第三方软件目录
    └── ffmpeg\
      ├── ffmpeg.exe

注意事项

本项目不包含腾讯云密钥，请自行配置！
文本文件请使用UTF-8编码
确保有足够的磁盘空间用于临时文件和最终输出
长文本会被自动分段处理，每段不超过150字符
使用腾讯云服务可能产生费用，请参考腾讯云的计费规则
GUI界面要求PyQt5和QFluentWidgets库支持

开发计划

故障排除

"系统找不到指定的文件"错误

如果遇到"语音合成失败: [WinError 2] 系统找不到指定的文件"错误，请检查以下几点：

配置文件名称：
- 确保在Config目录下创建了正确名称的配置文件：
  - tencent_cloud_secret_key.csv
  - tencent_cloud_voice_type.csv
目录结构：
- 确保项目目录结构正确，参考上述"项目结构"部分
权限问题：
- 确保程序有权限访问所有必要的文件和目录
- 尝试以管理员身份运行命令提示符或PowerShell
其他问题
- 腾讯云语音相关问题请访问：https://cloud.tencent.com/document/product/1073/34090

Name		Name	Last commit message	Last commit date
Latest commit History 24 Commits
AudioResources		AudioResources
Resources		Resources
config		config
images		images
test		test
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
audio_generator.py		audio_generator.py
build.py		build.py
requirements.txt		requirements.txt
tts_gui.py		tts_gui.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

腾讯云语音合成工具

功能特点

安装和设置

前提条件

安装步骤

使用方法

图形界面（推荐）

命令行工具

参数说明

支持的输出格式

示例

项目结构

注意事项

开发计划

故障排除

"系统找不到指定的文件"错误

About

Uh oh!

Releases 1

Packages

Uh oh!

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

腾讯云语音合成工具

功能特点

安装和设置

前提条件

安装步骤

使用方法

图形界面（推荐）

命令行工具

参数说明

支持的输出格式

示例

项目结构

注意事项

开发计划

故障排除

"系统找不到指定的文件"错误

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases 1

Packages 0

Uh oh!

Uh oh!

Contributors

Uh oh!

Languages

Packages