一、整体说明
1、主要功能
TTS(文本转语音)模型百花齐放、功能强大,但要使用上这些模型还是有一定坡度,【无垠配音】提供了Windows环境下众多TTS引擎调用的用户交互界面,降低了各TTS的使用门槛,让TTS模型使用平民化、简便化,您可以很方便的使用各TTS模型带来的文本转语音功能。
2、特点
⊙众多TTS引擎支持:目前支持IndexTTS2、QWen3TTS、Microsoft本机语音、GptSovits、VoxCPM1.5、IndexTTS1.5、VoxCPM0.5、Kokoro不同硬件要求的模型接入,未来根据需要适配更多TTS引擎。
⊙各TTS可灵活选择:根据需要与使用喜好,只需要下载对应的TTS包放到软件指定目录下,即可使用对应TTS的功能。
⊙软件纯本地运行:软件及所有TTS模型包均在本地运行,可断网使用,无需上云,无惧隐私,请放心使用。
⊙多种形式的配音方式:软件提供了文本配音、多角色文本配音、字幕配音、音视频二次配音、视频配音、有声书配音模式,覆盖了各种各样的配音使用场景。
⊙支持多角色配音:软件可根据需要,灵活设置每部分文本使用的发音人及语速等,便捷的实现多角色配音。
⊙自定义发音人支持与声音克隆:除TTS引擎默认提供的发音人外,IndexTTS、QWen3TTS、VoxCPM、Gptsovits可自定义发音人数据便捷实现声音克隆,可按需轻松克隆自已声音。
3、不足
为了统一调用入口,目前暂未支持某些TTS个性化调节功能。
软件依赖于各TTS引擎,在部分机子上可能无法应用,故如需注册使用,请先确保本机正常运行。
软件在本地运行,对硬件性能要一定要求,运行速度强依赖于本机性能。
4、后续
问题修复:软件提供了自动更新机制,非大版本更新的情况下,软件会自动检测更新修复的程序问题。
更多功能:软件会根据使用反馈与使用需要,在后续更新进一些新功能。
二、安装
软件下载地址:
百度网盘:https://pan.baidu.com/s/1I2uzXlN2isH8T-MD74ryiA?pwd=nqdw
夸克网盘:https://pan.quark.cn/s/29d2d3a7853d#/list/share
技术支持:
QQ-1733589017 微信-WuYinNet
QQ群-1037043109
软件分枝:
网盘文件:
如果想省事,Nvidia显卡,显存在8G或以上就直接下载 “无垠IndexTTS2配音专版”即可,下载后直接使用。
1、运行环境
操作系统:windows 10 19044及以上,64位
CPU:4核以上
内存:4GB以上
显存:如需音色克隆,需要Nvidia 4G以上,各TTS引擎对显卡要求详见引擎接入部分
2、安装
相关文件均在提供的安装文件夹中做了提供,请根据步骤操作。
①、安装微软常用运行库合集,如已安装可忽略。安装文件见文件夹中 “1、微软常用运行库合集 2025.10.18.exe”,安装方式比较简单,一路下一步到最后即可。
②、软件是基于微软.NET8开发的,需要安装相关运行时,如已安装也可忽略。
可选择到微软官方下载最新版运行时安装,地址:
https://dotnet.microsoft.com/zh-cn/download/dotnet/8.0
进入地址后,选择“.NET 桌面运行时”
③、启动软件
★请将软件放置在不含中文字符的路径文件夹中
A、在软件最外层包中会提供
B、或在内层提供
A、B两者择一双击运行程序主体。
软件运行后,会在桌面创建程序的快捷方式,后续通过桌面的快捷方式即可打开软件。
三、功能介绍
软件提供了文本配音、字幕配音、音视频二次配音、视频配音、有声书配音功能,为兼容各方TTS引擎,不管是文本配音还是有声书配音,针对长文本均是先将文本细化再逐一配音,然后再整合。软件左侧为待生成列表区,即从长文本、字幕中拆分出来的分段,生成时可灵活调整各分段的生成信息,右侧即为提供的发音人信息,可选择喜欢的用于左侧的列表生成。配音时使用整体形式是左侧对各配音分段/分片进行设置,列表项的编辑支持撤销与重做,同时按场景提供了各种右键菜单,一切设置完毕后,点击“生成”按钮形成最终结果。
| 主要功能点 | 功能说明 |
| 文本配音 | 最简单的文本配音,支持文本不长度不超10万字,仅允许单发音人,设置文本与发音人后直接生成 |
| 多角色文本配音 | 多个角色的发音人配音,适用于对话、剧情、批量配音生成的使用场景,可每一项单独设置发音人、语速等 |
| 字幕配音 | 对.srt格式的字幕进行配音,自动解析srt字幕后,配音严格按字幕起始时间对齐,会存在覆盖风险,但可快速批量处理 |
| 音视频二配 | 先对音视频生成字幕,然后再根据字幕对音视频二次配音,可直接预览配音效果 适用于音视频语种翻译、修改台词配音、方言配音等,支持原声、原情感配音 |
| 视频配音 | 适用于无音视频手动添加字幕与配音 |
| 有声书 | 可一次批量将纯文本转换为语音,适用于听书,无字数限制 |
| 音视频字幕处理 | 在音视频二配中的附带功能,用于提取音视频中的字幕及校正、翻译、发音人识别的处理,字幕的识别和翻译均提供了不同体量和种类的模型,可按需选择。 |
1、项目管理
软件以项目的形式进行管理,每个项目里提供了各种配音功能,如果要对多个文本或字幕等做配音,需要按不同文件建立不同的项目。
无论后续使用何种形式的配音,需要先创建项目或是使用之前已创建的项目。
在软件打开后即可进行项目的创建:
或者直接选择最近使用的项目。
2、文本配音
文本配音主要针对一般长度的文本配音使用,可方便进行多角色配音控制,支持选择的使用的文件是.txt文本文件,不支持10万字以上或是体积大于5M的文件。
当使用较长文本进行配音时,软件会自动按分段拆分文本为分片,对于较长分段再进行二次拆分 ,在配音完成后再进行合并,合并后段落与原文本一致。同时,可按指定的形式设计多人、多轮对话,格式为:
[说话人]说话内容
比如:以下设计三人的对话内容
[女1号]吃过饭没?[男3号]吃过了,你呢?[女3号]我们一起吃过了。[女1号]是的,我们一起吃了一个鱼,味道还不错,下次一起去吃。[男3号]要得。哎,上次和你说的事怎么样了?
软件会识别提供的内容并拆分为需要配音的列表,然后进行配音。
3、字幕配音
字幕配音目前仅支持单语言.srt格式文件解析使用,当选择或拖入字幕文件后,会自动解析并形成配音列表,后续操作形式与文本配音一致。
4、音视频二配
音视频二次配音是先将音视频中的字幕提取出来,然后进行配音,支持原音与配音播放,后续其它操作与字幕配音一致。
软件提供了基础的字幕提取,如有更多要求(翻译、发音人/说话人识别),可使用完全本地运行的“无垠字幕助手”或借用各种在线AI大模型进行处理,更推荐使用各种在线AI大模型对字幕二行校正与二次处理。
5、视频配音
视频配音为尝试性功能,可以视频需要的地方添加上字幕项进行配音,后续根据需要进行更多完善。
6、有声书配音
有声书配音主要针对长文本书籍或小说,仅支持单发音人,可根据小说章节进行切分配音导出。
7、发音人配置
发音人配置用于管理软件中的发音人,可自定义音色然后配置语音克隆引擎进行声音克隆。
发音人配置入口:
①“设置”菜单 → “多音字配置”
② 界面右侧配音设置中出现
,点击可直接出进入发音人配置
自定义语音克隆音色:
添加完成音色后,在配音界面右侧的发音人列表中会出现,此时即可用于左侧列表项进行语音克隆。
8、多音字配置
目前各TTS对多音字的支持还是比较好的,但某些多音字在配音过程中还是会出现错读,此时,可配置多音字后,再进行语音项生成,但注意:仅部分引擎支持多音字功能,比如EdgeTTS、MicroTTS、VoxCPM、IndexTTS、GptSoVitsV2PP,其中IndexTTS与EdgeTTS、MicroTTS对多音字的支持最好,如果硬件支持,最推荐使用这些对多音字支持较好的语音引擎。
多音字配置入口:
①“设置”菜单 → “多音字配置”
② 界面中出现“多”字的按钮
,点击可直接出现多音字配置
注意:★不需要将未使用的多音字加入,各引擎默认已经对多音字进行了一定的处理,如出现错读后再进行配置。
四、TTS引擎接入
软件提供了多种纯本地运行的TTS引擎,根据使用需要进行安装即可,不需要全部下载。如果需要音色克隆,推荐IndexTTS系列或VoxCPM系列,所有TTS运行全依赖本地计算机性能。
| TTS引擎 | 特点与限制 | 推荐指数 |
| IndexTTS2 | 特点:中、英文克隆最强 要求:需要Nvidia显卡8G显存或以上 放置路径:App\TTSEngine\IndexTTS2 |
★★★★★ |
| VoxCPM1.5 | 特点:方言克隆还原性更好,硬件要求低 要求:建议Nvidia显卡8G显存 放置路径:App\TTSEngine\VoxCPM1.5 |
★★★★ |
| QWen3TTS | 特点:支持克隆中、英、日、韩、俄、法、意等9种语言 要求:1.7B版本需要Nvidia显卡8G显存或以上、0.6B至少需要4G显存 放置路径:App\TTSEngine\QWen3TTS |
★★★★ |
| IndexTTS1.5 | 特点:4G显存环境中中、英文克隆效果最好,速度快 要求:需要Nvidia显卡4G显存 放置路径:App\TTSEngine\IndexTTS1.5 |
★★★★ |
| VoxCPM |
特点:方言克隆还原性好,运行快
要求:需要Nvidia显卡4G显存
放置路径:App\TTSEngine\VoxCPM
|
★★★ |
| GPTSovits2PlusPro |
特点:中规中矩,效果一般
要求:需要Nvidia显卡4G显存
放置路径:App\TTSEngine\GPTSoVITSV2PP
|
★★ |
| Kokoro |
特点:无需显卡,CPU即可运行,软件自带,音色丰富,运行速度快
要求:搭配Win10及以上系统的任意电脑
放置路径:App\TTSEngine\KokoroOnnx
|
★★ |
| 微软自然语音 |
特点:运行速度最快,安装方式特殊,音色有限
要求:Win10及以上系统
放置路径:任意位置
|
★ |
所有的TTS引擎包放在网盘文件夹:
1、IndexTTS2
IndexTTS2是目前提供的TTS引擎包中对中、英文克隆效果最好的模型,但需要Nvidia显卡,至少8G显存
安装步骤:
下载TTS引擎包
解压后放到 /APP/TTSEngine下,最后的目录路径应该是 /APP/TTSEngine/IndexTTS2, IndexTTS2文件下个下应该包含Start.bat,注意不要嵌套额外的层
2、VoxCPM1.5
VoxCPM1.5在方言的克隆效果上较好,模型推理速度较快,如果要进行方言配音,建议优先选择。与下面VoxCPM版本不同,请注意区分,1.5比下面的VoxCPM0.5效果更好,但硬件要求也更高。
本TTS引擎支持语音克隆,需要Nvidia显卡,建议8G或以上显存。
安装步骤:
下载TTS引擎包
解压后放到 /APP/TTSEngine下,最后的目录路径应该是 /APP/TTSEngine/VoxCPM1.5, VoxCPM1.5文件下个下应该包含Start.bat,注意不要嵌套额外的层
3、QWen3TTS
QWen3TTS语音引擎,支持中、英、日、韩、德、法、俄、葡萄牙、西班牙和意大利、和各种方言语音克隆,本次提供了两个不同体量的模型:
0.6B包,需要Nvidia显卡,最低4G显存。
1.7B包,需要Nvidia显卡,需要8G显存。
安装步骤:
根据硬件条件,下载对应体量的TTS引擎包。
解压后放到 /APP/TTSEngine下,最后的目录路径应该是 /APP/TTSEngine/QWen3TTS, QWen3TTS文件下个下应该包含Start.bat,注意不要嵌套额外的层
4、IndexTTS1.5
本TTS引擎支持语音克隆,需要Nvidia显卡,最低4G显存,是4G显存条件下首推语音克隆工具。
安装步骤:
下载TTS引擎包
解压后放到 /APP/TTSEngine下,最后的目录路径应该是 /APP/TTSEngine/IndexTTS1.5, IndexTTS1.5文件下个下应该包含Start.bat,注意不要嵌套额外的层
5、VoxCPM
本TTS引擎支持语音克隆,需要Nvidia显卡,最低4G显存。版本为0.5,请注意与上面1.5版区别。
VoxCPM也是一款不错的声音克隆引擎,在方言克隆效果上表现出众。
安装步骤:
下载TTS引擎包
解压后放到 /APP/TTSEngine下,最后的目录路径应该是 /APP/TTSEngine/VoxCPM, VoxCPM文件下个下应该包含Start.bat,注意不要嵌套额外的层
6、GptSovits
GptSovits作为老牌语音克隆引擎,本次提供的为GptSovitsV2ProPlus.
本TTS引擎支持语音克隆,需要Nvidia显卡,最低4G显存。
安装步骤:
下载TTS引擎包
解压后放到 /APP/TTSEngine下,最后的目录路径应该是 /APP/TTSEngine/GPTSoVITSV2PP, GPTSoVITSV2PP文件下个下应该包含Start.bat,注意不要嵌套额外的层
7、Kokoro引擎
软件包默认支持离线Kokoro引擎,已打包在软件中,此TTS引擎可以纯CPU下运行,如果有GPU更佳,无需要额外操作。此引擎提供了103个发音人,即使在纯CPU的环境下,运行也较快。
8、微软自然语音发音人
Win10及以上可以尝试安装微软默认的一些语音包,提供的压缩包中带了11个发音人,无需要GPU也可运行,速度非常快。
中文:晓晓/云溪
英国:Sonia/Ryan
美国:Aria/Guy/Jenny
日本:Nanami/Keita
韩国:SunHi/InJoon
语音包安装步骤:
首先下载语音包
下开完成后,复制到软件目录下的 /TTSEngine/MicroTTSAPI
解压后修改得到的文件夹名为:MicroTTS
即最后得到的路径应该为:/TTSEngine/MicroTTSAPI/MicroTTS
有两个子文件夹,打开名为“NaturalVoiceSAPIAdapter_v0.2.5_x86_x64_2”的文件夹,
运行
设置参考如下:32位与64位均做安装,勾选本地讲述人语音下的”启用讲述人自然语音“★,然后设置”本地语音路径“,选择解析出来文件夹下的voices文件夹,应该为xxxx/TTSEngine/MicroTTSAPI/MicroTTS/voices★★★
然后打开同层目录下的”x86“文件夹,运行TtsApplication.exe后,点击”朗读“按钮,如果能正常发音,则说明安装成功。
五、技术支持
1、联系我们
软件在“帮助”菜单→“问题反馈”与软件顶部的问号中均提供了技术支持方式,如遇问题,欢迎反馈,以帮助软件做得更好,对此十分感谢。
目前主要通过QQ与微信在线提供技术支持,对于软件使用过程中出现的问题,在修改后发布后,下次启动软件会尝试联网进行升级,也可以到程序目录下双击
进行软件更新。
2、产品注册
目前软件支持三天的试用期,如果软件能正常使用且满足你的一些使用需要,试用期过后,欢迎注册,注册形式为一机一码。请通过提供的技术支持联系方式进行沟通,提供机器码后获取注册码进行注册。
QQ-1733589017 微信-WuYinNet
QQ群-1013043308