无垠配音帮助文档

一、整体说明

1、主要功能

TTS（文本转语音）模型百花齐放、功能强大，但要使用上这些模型还是有一定坡度，【无垠配音】提供了Windows环境下众多TTS引擎调用的用户交互界面，降低了各TTS的使用门槛，让TTS模型使用平民化、简便化，您可以很方便的使用各TTS模型带来的文本转语音功能。

2、特点

⊙众多TTS引擎支持：目前支持IndexTTS2、QWen3TTS、Microsoft本机语音、GptSovits、VoxCPM1.5、IndexTTS1.5、VoxCPM0.5、Kokoro不同硬件要求的模型接入，未来根据需要适配更多TTS引擎。

⊙各TTS可灵活选择：根据需要与使用喜好，只需要下载对应的TTS包放到软件指定目录下，即可使用对应TTS的功能。

⊙软件纯本地运行：软件及所有TTS模型包均在本地运行，可断网使用，无需上云，无惧隐私，请放心使用。

⊙多种形式的配音方式：软件提供了文本配音、多角色文本配音、字幕配音、音视频二次配音、视频配音、有声书配音模式，覆盖了各种各样的配音使用场景。

⊙支持多角色配音：软件可根据需要，灵活设置每部分文本使用的发音人及语速等，便捷的实现多角色配音。

⊙自定义发音人支持与声音克隆：除TTS引擎默认提供的发音人外，IndexTTS、QWen3TTS、VoxCPM、Gptsovits可自定义发音人数据便捷实现声音克隆，可按需轻松克隆自已声音。

3、不足

为了统一调用入口，目前暂未支持某些TTS个性化调节功能。

软件依赖于各TTS引擎，在部分机子上可能无法应用，故如需注册使用，请先确保本机正常运行。

软件在本地运行，对硬件性能要一定要求，运行速度强依赖于本机性能。

4、后续

问题修复：软件提供了自动更新机制，非大版本更新的情况下，软件会自动检测更新修复的程序问题。

更多功能：软件会根据使用反馈与使用需要，在后续更新进一些新功能。

二、安装

软件下载地址：

百度网盘：https://pan.baidu.com/s/1I2uzXlN2isH8T-MD74ryiA?pwd=nqdw

夸克网盘：https://pan.quark.cn/s/29d2d3a7853d#/list/share

技术支持：

QQ-1733589017 微信-WuYinNet

QQ群-1037043109

软件分枝：

网盘文件：

如果想省事，Nvidia显卡，显存在8G或以上就直接下载 “无垠IndexTTS2配音专版”即可，下载后直接使用。

1、运行环境

操作系统：windows 10 19044及以上，64位

CPU：4核以上

内存：4GB以上

显存：如需音色克隆，需要Nvidia 4G以上，各TTS引擎对显卡要求详见引擎接入部分

2、安装

相关文件均在提供的安装文件夹中做了提供，请根据步骤操作。

①、安装微软常用运行库合集，如已安装可忽略。安装文件见文件夹中 “1、微软常用运行库合集 2025.10.18.exe”，安装方式比较简单，一路下一步到最后即可。

②、软件是基于微软.NET8开发的，需要安装相关运行时，如已安装也可忽略。

可选择到微软官方下载最新版运行时安装，地址：

https://dotnet.microsoft.com/zh-cn/download/dotnet/8.0

进入地址后，选择“.NET 桌面运行时”

③、启动软件

★请将软件放置在不含中文字符的路径文件夹中

A、在软件最外层包中会提供

B、或在内层提供

A、B两者择一双击运行程序主体。

软件运行后，会在桌面创建程序的快捷方式，后续通过桌面的快捷方式即可打开软件。

三、功能介绍

软件提供了文本配音、字幕配音、音视频二次配音、视频配音、有声书配音功能，为兼容各方TTS引擎，不管是文本配音还是有声书配音，针对长文本均是先将文本细化再逐一配音，然后再整合。软件左侧为待生成列表区，即从长文本、字幕中拆分出来的分段，生成时可灵活调整各分段的生成信息，右侧即为提供的发音人信息，可选择喜欢的用于左侧的列表生成。配音时使用整体形式是左侧对各配音分段/分片进行设置，列表项的编辑支持撤销与重做，同时按场景提供了各种右键菜单，一切设置完毕后，点击“生成”按钮形成最终结果。

主要功能点	功能说明
文本配音	最简单的文本配音，支持文本不长度不超10万字，仅允许单发音人，设置文本与发音人后直接生成
多角色文本配音	多个角色的发音人配音，适用于对话、剧情、批量配音生成的使用场景，可每一项单独设置发音人、语速等
字幕配音	对.srt格式的字幕进行配音，自动解析srt字幕后，配音严格按字幕起始时间对齐，会存在覆盖风险，但可快速批量处理
音视频二配	先对音视频生成字幕，然后再根据字幕对音视频二次配音，可直接预览配音效果适用于音视频语种翻译、修改台词配音、方言配音等，支持原声、原情感配音
视频配音	适用于无音视频手动添加字幕与配音
有声书	可一次批量将纯文本转换为语音，适用于听书，无字数限制
音视频字幕处理	在音视频二配中的附带功能，用于提取音视频中的字幕及校正、翻译、发音人识别的处理，字幕的识别和翻译均提供了不同体量和种类的模型，可按需选择。

1、项目管理

软件以项目的形式进行管理，每个项目里提供了各种配音功能，如果要对多个文本或字幕等做配音，需要按不同文件建立不同的项目。

无论后续使用何种形式的配音，需要先创建项目或是使用之前已创建的项目。

在软件打开后即可进行项目的创建：

或者直接选择最近使用的项目。

2、文本配音

文本配音主要针对一般长度的文本配音使用，可方便进行多角色配音控制，支持选择的使用的文件是.txt文本文件，不支持10万字以上或是体积大于5M的文件。

当使用较长文本进行配音时，软件会自动按分段拆分文本为分片，对于较长分段再进行二次拆分，在配音完成后再进行合并，合并后段落与原文本一致。同时，可按指定的形式设计多人、多轮对话，格式为：

[说话人]说话内容

比如：以下设计三人的对话内容

[女1号]吃过饭没？

[男3号]吃过了，你呢？

[女3号]我们一起吃过了。

[女1号]是的，我们一起吃了一个鱼，味道还不错，下次一起去吃。

[男3号]要得。哎，上次和你说的事怎么样了？

软件会识别提供的内容并拆分为需要配音的列表，然后进行配音。

3、字幕配音

字幕配音目前仅支持单语言.srt格式文件解析使用，当选择或拖入字幕文件后，会自动解析并形成配音列表，后续操作形式与文本配音一致。

4、音视频二配

音视频二次配音是先将音视频中的字幕提取出来，然后进行配音，支持原音与配音播放，后续其它操作与字幕配音一致。

软件提供了基础的字幕提取，如有更多要求(翻译、发音人/说话人识别)，可使用完全本地运行的“无垠字幕助手”或借用各种在线AI大模型进行处理，更推荐使用各种在线AI大模型对字幕二行校正与二次处理。

5、视频配音

视频配音为尝试性功能，可以视频需要的地方添加上字幕项进行配音，后续根据需要进行更多完善。

6、有声书配音

有声书配音主要针对长文本书籍或小说，仅支持单发音人，可根据小说章节进行切分配音导出。

7、发音人配置

发音人配置用于管理软件中的发音人，可自定义音色然后配置语音克隆引擎进行声音克隆。

发音人配置入口：

①“设置”菜单 → “多音字配置”

② 界面右侧配音设置中出现

，点击可直接出进入发音人配置

自定义语音克隆音色：

添加完成音色后，在配音界面右侧的发音人列表中会出现，此时即可用于左侧列表项进行语音克隆。

8、多音字配置

目前各TTS对多音字的支持还是比较好的，但某些多音字在配音过程中还是会出现错读，此时，可配置多音字后，再进行语音项生成，但注意：仅部分引擎支持多音字功能，比如EdgeTTS、MicroTTS、VoxCPM、IndexTTS、GptSoVitsV2PP，其中IndexTTS与EdgeTTS、MicroTTS对多音字的支持最好，如果硬件支持，最推荐使用这些对多音字支持较好的语音引擎。

多音字配置入口：

①“设置”菜单 → “多音字配置”

② 界面中出现“多”字的按钮

，点击可直接出现多音字配置

注意：★不需要将未使用的多音字加入，各引擎默认已经对多音字进行了一定的处理，如出现错读后再进行配置。

四、TTS引擎接入

软件提供了多种纯本地运行的TTS引擎，根据使用需要进行安装即可，不需要全部下载。如果需要音色克隆，推荐IndexTTS系列或VoxCPM系列，所有TTS运行全依赖本地计算机性能。

TTS引擎	特点与限制	推荐指数
IndexTTS2	特点：中、英文克隆最强要求：需要Nvidia显卡8G显存或以上放置路径：App\TTSEngine\IndexTTS2	★★★★★
VoxCPM1.5	特点：方言克隆还原性更好，硬件要求低要求：建议Nvidia显卡8G显存放置路径：App\TTSEngine\VoxCPM1.5	★★★★
QWen3TTS	特点：支持克隆中、英、日、韩、俄、法、意等9种语言要求：1.7B版本需要Nvidia显卡8G显存或以上、0.6B至少需要4G显存放置路径：App\TTSEngine\QWen3TTS	★★★★
IndexTTS1.5	特点：4G显存环境中中、英文克隆效果最好，速度快要求：需要Nvidia显卡4G显存放置路径：App\TTSEngine\IndexTTS1.5	★★★★
VoxCPM	特点：方言克隆还原性好，运行快要求：需要Nvidia显卡4G显存放置路径：App\TTSEngine\VoxCPM	★★★
GPTSovits2PlusPro	特点：中规中矩，效果一般要求：需要Nvidia显卡4G显存放置路径：App\TTSEngine\GPTSoVITSV2PP	★★
Kokoro	特点：无需显卡，CPU即可运行，软件自带，音色丰富，运行速度快要求：搭配Win10及以上系统的任意电脑放置路径：App\TTSEngine\KokoroOnnx	★★
微软自然语音	特点：运行速度最快，安装方式特殊，音色有限要求：Win10及以上系统放置路径：任意位置	★

所有的TTS引擎包放在网盘文件夹：

1、IndexTTS2

IndexTTS2是目前提供的TTS引擎包中对中、英文克隆效果最好的模型，但需要Nvidia显卡，至少8G显存

安装步骤：

下载TTS引擎包

解压后放到 /APP/TTSEngine下，最后的目录路径应该是 /APP/TTSEngine/IndexTTS2， IndexTTS2文件下个下应该包含Start.bat，注意不要嵌套额外的层

2、VoxCPM1.5

VoxCPM1.5在方言的克隆效果上较好，模型推理速度较快，如果要进行方言配音，建议优先选择。与下面VoxCPM版本不同，请注意区分，1.5比下面的VoxCPM0.5效果更好，但硬件要求也更高。

本TTS引擎支持语音克隆，需要Nvidia显卡，建议8G或以上显存。

安装步骤：

下载TTS引擎包

解压后放到 /APP/TTSEngine下，最后的目录路径应该是 /APP/TTSEngine/VoxCPM1.5， VoxCPM1.5文件下个下应该包含Start.bat，注意不要嵌套额外的层

3、QWen3TTS

QWen3TTS语音引擎，支持中、英、日、韩、德、法、俄、葡萄牙、西班牙和意大利、和各种方言语音克隆，本次提供了两个不同体量的模型：

0.6B包，需要Nvidia显卡，最低4G显存。

1.7B包，需要Nvidia显卡，需要8G显存。

安装步骤：

根据硬件条件，下载对应体量的TTS引擎包。

解压后放到 /APP/TTSEngine下，最后的目录路径应该是 /APP/TTSEngine/QWen3TTS， QWen3TTS文件下个下应该包含Start.bat，注意不要嵌套额外的层

4、IndexTTS1.5

本TTS引擎支持语音克隆，需要Nvidia显卡，最低4G显存，是4G显存条件下首推语音克隆工具。

安装步骤：

下载TTS引擎包

解压后放到 /APP/TTSEngine下，最后的目录路径应该是 /APP/TTSEngine/IndexTTS1.5， IndexTTS1.5文件下个下应该包含Start.bat，注意不要嵌套额外的层

5、VoxCPM

本TTS引擎支持语音克隆，需要Nvidia显卡，最低4G显存。版本为0.5，请注意与上面1.5版区别。

VoxCPM也是一款不错的声音克隆引擎，在方言克隆效果上表现出众。

安装步骤：

下载TTS引擎包

解压后放到 /APP/TTSEngine下，最后的目录路径应该是 /APP/TTSEngine/VoxCPM， VoxCPM文件下个下应该包含Start.bat，注意不要嵌套额外的层

6、GptSovits

GptSovits作为老牌语音克隆引擎，本次提供的为GptSovitsV2ProPlus.

本TTS引擎支持语音克隆，需要Nvidia显卡，最低4G显存。

安装步骤：

下载TTS引擎包

解压后放到 /APP/TTSEngine下，最后的目录路径应该是 /APP/TTSEngine/GPTSoVITSV2PP， GPTSoVITSV2PP文件下个下应该包含Start.bat，注意不要嵌套额外的层

7、Kokoro引擎

软件包默认支持离线Kokoro引擎，已打包在软件中，此TTS引擎可以纯CPU下运行，如果有GPU更佳，无需要额外操作。此引擎提供了103个发音人，即使在纯CPU的环境下，运行也较快。

8、微软自然语音发音人

Win10及以上可以尝试安装微软默认的一些语音包，提供的压缩包中带了11个发音人，无需要GPU也可运行，速度非常快。

中文：晓晓/云溪

英国：Sonia/Ryan

美国：Aria/Guy/Jenny

日本：Nanami/Keita

韩国:SunHi/InJoon

语音包安装步骤：

首先下载语音包

下开完成后，复制到软件目录下的 /TTSEngine/MicroTTSAPI

解压后修改得到的文件夹名为：MicroTTS

即最后得到的路径应该为：/TTSEngine/MicroTTSAPI/MicroTTS

有两个子文件夹，打开名为“NaturalVoiceSAPIAdapter_v0.2.5_x86_x64_2”的文件夹，

运行

设置参考如下：32位与64位均做安装，勾选本地讲述人语音下的”启用讲述人自然语音“★，然后设置”本地语音路径“，选择解析出来文件夹下的voices文件夹，应该为xxxx/TTSEngine/MicroTTSAPI/MicroTTS/voices★★★

然后打开同层目录下的”x86“文件夹，运行TtsApplication.exe后，点击”朗读“按钮，如果能正常发音，则说明安装成功。

五、技术支持

1、联系我们

软件在“帮助”菜单→“问题反馈”与软件顶部的问号中均提供了技术支持方式，如遇问题，欢迎反馈，以帮助软件做得更好，对此十分感谢。

目前主要通过QQ与微信在线提供技术支持，对于软件使用过程中出现的问题，在修改后发布后，下次启动软件会尝试联网进行升级，也可以到程序目录下双击

进行软件更新。

2、产品注册

目前软件支持三天的试用期，如果软件能正常使用且满足你的一些使用需要，试用期过后，欢迎注册，注册形式为一机一码。请通过提供的技术支持联系方式进行沟通，提供机器码后获取注册码进行注册。

QQ-1733589017 微信-WuYinNet

QQ群-1013043308