当前版本:

v1.0.6.5

友情提示:

  1. ZTJ-TTS定位为VIP福利!本工具所有功能有文档,有视频,简单问题请自行查阅学习,BUG或意见建议请加群按照提交规则进行反馈,使用本工具不提供任何1对1解答服务!!!
  2. 问题反馈:点击软件左下角添加Q群提交,提交bug请按照群文件内bug提交规则进行,非此Q群内提交未按照Q群内bug提交规则提交概不处理!!!
  3. 注意:使用微软新添加9个角色进行语音合成时,不要勾选使用导出SRT,新角色暂时不支持导出SRT。
  4. 非VIP用户仅开放基本TTS合成功能,且合成内容有长度限制,无次数限制!
  5. 首次使用,请仔细阅读以下文档/视频,磨刀不误砍柴功!

主要功能:

文本转语音(微软Azure免费/收费接口/Edge接口/火山TTS接口/OpenAI TTS接口)、Srt字幕编辑、Srt字幕合成语音、AI语音识别导出srt、txt、vtt、lic


界面


关于微软Azure免费TTS接口说明:

一、2023.10.25下午开始,微软官方对TTS免费接口合成次数进行了限制,每日合成上限为20次,此限制是基于当前机器公网IP地址,问题表现一直合成失败429("code":"TooManyRequests","message":"The rate limit has been reached. The timeout in seconds can be found in the Retry-After header."),当合成次数达到上限后,此公网IP就需要等待24小时后才可以继续合成,应对策略:

  • 1、最新版本为网站VIP用户增加了VIP共享代理线路,默认所有VIP用户限额5个IP/账号/天(使用VIP共享代理线路时日志窗口会有额度信息显示),IP有效期为1-5分钟,每个IP可合成10-20次,满足大家日常合成几万字符的基本使用需求,使用方法及相关说明见视频教程(https://ztjun.fun/2323.html),有更高使用需求的朋友可选择为指定账号单独购买不重复自定义代理IP套餐,套餐价格如下(注意:不是网站VIP用户不要购买,购买了也无法使用
    • 10IP/天*30天=20元;
    • 25IP/天*30天=40元;
    • 50IP/天*30天=70元;
    • 100IP/天*30天=128元;
    • 网站VIP用户自定义代理IP套餐购买方法:下方二维码扫码支付,完成后联系QQ:50711698,发送软件登录用户名,等待指定账号自定义代理IP额度开通即可。
  • 2、有条件的优先推荐申请使用官方的apikey,官方Apikey免费额度为每月50W字符(点击观看视频教程),注意:微软官方是以token计量,实际使用远达不到50W字符
  • 3、自行购买HTTPS/SOCKS5代理,可绕过此限制,前提:要求代理节点IP够多,够干净,否则用的人多了,很快就会被大范围限制;
  • 4、临时应急可以通过使用全局代理切换公网IP,如果是家庭环境,则可以通过重新拔号上网达到切换公网IP的目的,如果可以连接手机热点,则可以通过手机端开启/关闭飞行模式达到切换公网IP的目的(注意:公网IP资源有限,并不是说你切换了一个新的公网IP就一定可以合成20次,可以合成20次的前提是,你拿到的这个公网IP在你之前24小时内,没有被别人用于微软TTS合成,如果这个公网IP被别人拿去合成过,那20次用一次就少一次,如果被别人把20次用完,你直接就会是429,所以:“为什么我切换了IP还是429?”,答案:“你切换的这个新公网IP在24小时内已经被别人拿去合成过了”);

二、2023.12.8日傍晚开始,微软TTS免费接口对TTS合成音频音质进行了限制,目前仅支持24khz-16bit音质,后续ZTJ-TTS中使用微软TTS免费接口时,音质选项将不再生效,使用微软官方APIKEY不受此影响;


视频教程


文字教程

1、接口

  • 微软Azure:支持文本配音、导出Srt字幕、Srt字幕配音,同时支持使用官方API(需要自行申请注册 Azure TTS 服务 apikey)

  • Edge朗读:支持文本配音、Srt字幕配音

  • 火山TTS:支持文本配音、导出Srt字幕、Srt字幕配音(需要自行申请注册申请Apikey)

  • OpenAI TTS:支持文本配音(需要Apikey)

2、角色

  • 当前角色(旁白角色)

    合成文本不进行角色设置时,将直接使用此处角色进行TTS语音合成,如果合成文本中存在角色设置,则对文本中所有没有指定角色的文本使用此处角色进行配音,和旁白的类似

  • 角色列表

    文本配音时有多角色需求时,可以先在当前角色区域将所需要的角色参数调整设置好,然后点击[添加]按钮,即可将此角色加入角色列表,加入角色列表后,才可以在右侧文本编辑区域进行角色设置,角色列表最多支持50个角色。

  • 保存角色数据

    • 在多角色列表区域点击鼠标右键,弹出菜单--保存 即可,需要使用时,同样在多角色列表区域点击鼠标右键,弹出菜单--载入 即可

 

3、文本配音

3.1、中小文本

  • 角色试听

    以左侧当前角色设置参数试听当前文本内容,支持选择指定文本试听;

  • 设置角色

    使用此功能需要在左侧列表先添加角色,然后使用指定角色对选中范围文本内容进行标记,进行过角色标记的内容在后面进行语音合成时,将以指定的角色设置进行语音合成。

    使用方法:在中小文本编辑区域,选择要指定角色的文本内容,鼠标右键--设置角色--选择左侧角色列表中添加好的指定角色即可。

    注意:不支持角色嵌套,如果存在角色嵌套会导致无法合成(角色嵌套是指在已指定角色的文本中再次指定其它角色)

    角色嵌套示例:{R云健(男性)(1)|xxx{R晓辰(女性)(0)|xxxxxxxxxxxxxxxR}xxxR}

  • 插入间隔

    在当前光标位置插入指定时长间隔,单位为毫秒(ms),1000ms=1秒(注意:Edge接口不支持插入间隔功能)

3.2、超大文本
  • 支持文件格式:编码格式为utf8的txt文档,非utf8编码将显示编码错误

    image-20230927102814577

  • 导入方法

    • 拖放:选择需要导入的txt文件,直接拖到软件界面导入

    • 超大文本表格区域鼠标右键--导入,选择文件完成导入

  • 不限制文件大小

    • 小提示:通常情况下,20000字符中文内容,合成音频后的时长约为2小时(120分钟)左右,以此类推,10000字符中文内容长度合成音频时长约为1小时左右,1600字符中文内容合成音频时长约为10分钟。

3.3、全局间隔

全局间隔,主要用于一键设置全文所有语句间隔停顿时间,勾选启用。

3.4、导出Srt字幕

文本配音时是否同步导出Srt字幕,勾选启用(为确保成功率和准确率,使用此功能时单次字符数量不得超过25000

注意:普通文本配音与导出Srt字幕的文本配音是两种截然不同的模式,合成效果也会有所不同,另外导出Srt字幕模式的文本配音不支持自定义插入间隔,两者有冲突,有可能造成合成失败。

小提示:导出Srt字幕时根据角色语速不同,需要对全局间隔参数进行微调,具体的全局间隔数值需要自己进行耐心调校测试,否则生成效果可能会不尽人意。

3.5、多音字
  • 直接使用拼音替代

    使用查拼音功能查完后,将文本中需要指定音调的多音字使用查询到的指定音调的拼音替换

  • 编辑替换多音字列表

设置选项--编辑替换多音字列表--弹出窗口,输入原始多音字英文逗号替换的同音字,一行一个,如上图所示,编辑完成后,点击确定即可

注意:此处将直接对合成文本中的多音字进行全局替换,所以使用多音字替换后,导出Srt时,需要对导出的Srt中的多音字文本进行手动还原。

4、字幕配音

4.1、字幕编辑

字幕编辑表格区域点击鼠标右键--导入,导入需要编辑的Srt字幕文件,导入完成后就可以开始修改,修改完成后,点击鼠标右键--保存,即可将修改后的srt进行保存

4.2、字幕配音

  • 导入:导入字幕,或者直接将Srt字幕文件拖动到软件界面完成导入

  • 清空:清空列表

注意:!!!

根据Srt字幕内容进行配音,需要注意,此模式对Srt字幕文件合理性要求较高,所谓字幕文件合理性,是指逐条字幕内容与其所对应的时间轴是否匹配,简单举例:

5
00:00:12,381 --> 00:00:14,109
这就是为什么我们将选项放在一起的原因让您了解我们的指南

以上是字幕文件中的一组字幕数据,含义如下:

序号

字幕开始时间:00:00:12,381 --> 字幕结束时间:00:00:14,109

字幕内容:这就是为什么我们将选项放在一起的原因让您了解我们的指南

空行结束

以上是一条标准的SRT字幕格式,包含序号、字幕开始/结束时间、字幕文本内容、空行结束,缺一不可!

通过简单计算可获取此条字幕内容显示的时间=结束时间(14.109)-开始时间(12.381)=1.728(秒)

这就是非常典型不合理的字幕文件,因为正常情况下,这么长的一段字幕内容,完整表述所需的时间绝对不止1.728秒,

如果你的字幕文件存在类似于这种不合理的时间轴,软件为了准确对齐时间轴,就只能对这段内容的音频进行加速处理,以缩短这条字幕音频的时长,让其小于1.728秒,如果不对这段字幕对应的音频进行加速处理,那么这条音频就无法在时间轴指定的时间内播放完成,它就会直接影响下一条字幕,造成尾压头声音重叠的问题。

反向总结:如果你在进行Srt字幕配音时,发现最终音频中时不时有语句突然加速的现象,那么,请参照上述内容,自行手动调整加速语句对应Srt字幕文件时间轴,以确保其合理性。

小提示:这种问题通常都是对字幕文件进行翻译以后出现,原因就是原始字幕文件的时间轴使用原始语言是合理的,经过翻译后同样一句话,内容长度会发生变化,而此时时间轴没变,这才是根源。

语音识别

注意:1、系统必须要为64位;2、根据需要自行下载模型文件(*.bin),模型下载完成后需要移动到软件目录下的whisper文件夹中

  • 1、选择音视频目录:选择需要进行语音识别的音视频文件保存目录,软件将对指定目录下所有*.mp4/*.mp3/*.wav文件进行批量AI语音识别;
  • 2、选择语音:选择音视频文件的语言类型,zh:中文,en:英文,找不到或是不知道就保持默认:auto即可。
  • 3、选择模型:模型越大,需要内存越大,识别结果越准确,识别时间也会越长,点此下载模型文件,参考如下:
  • 4、输出文件:识别出的文本内容保存格式,当前支持输出 txt/srt/vtt/lrc 格式,识别成功后,输出文本文件保存在音视频文件相同目录且名称相同。

设置选项

  • 微软TTS线路测试:免费线路延迟测试(通常情况下,晚上是使用高峰期,此时免费接口服务器响应会变慢,甚至无响应,导致合成失败)

  • 保存目录:TTS合成音频保存目录

    • 打开:打开保存目录

    • 选择文件夹:选择音频保存目录

  • 超大文本合成音频使用原始文件名命名:在超长文本模式下生效,勾选后,最终合并音频文件名以“原始导入文本文件名_All”进行命名

  • 合成结束打开保存目录:在语音合成任务完成后打开保存目录(如果保存文件夹已经有打开则不会再打开)

  • 合成结束是否播放提示音:勾选播放,不勾选不播放

  • 分段音频合并数量:在进行超长文本合并时,如果将所有音频进行完整合并,最终生成的音频文件将会非常大,动辙几GB,于是采取了二级合并的模式,可以自行根据需求按指定数量合并(如果还是不能理解,打个比方,你的文本合成音频后,有300个音频文件,如果对这300个音频文件进行完整合并,最终合成的文件只有一个,且文件大小将会达到几GB,不方便移动传输,且合成时’E9会非常长,现增加的二级合并,意思就是按照指定的数量对前面生成的300个文件进行合并,比如默认二级合并数量50,意思就是以50个音频为一组,对前面的300个音频进行分开合并,这样300个音频文件合成完成后,就会生成6个二级合并的音频文件,每个二级合并音频文件大小就会降到几百MB)

  • 是否进行最终完整合并:就是将所有分段音频文件合并成一个音频文件。

  • 合成结束添加背景音乐:TTS语音合成完成后,自动添加指定/随机随机音乐,
    • 添加指定背景音乐,点击按钮弹出音频文件选择窗口,选择相应的背景音乐即可;
    • 添加随机背景音乐,在第一次弹出的音频选择窗口点击“取消”,然后软件会自动进入文件夹浏览选择窗口,选择背景音乐所在文件夹后确定即可。
    • 循环:勾选后,当TTS语音时间很长,而背景音乐时长较短时,会重复循环播放背景音乐,直到TTS音频结束,不勾选时,背景音乐播放一次就会结束播放;
  • 自定义代理:

解决微软免费接口访问速率限制(429问题),使用方法:设置代理的IP地址和端口后,选择相应的代理类型,最后勾选上面的启用即可。

  • VIP共享代理:解决微软免费接口访问速率限制(429问题)

使用说明:根据自己网络选择对应线路后,再勾选上面的启用即可。

注意:增加VIP共享代理目的就是为了满足大家使用微软免费接口基本使用需求,同时由于代理价格高昂,也为了避免滥用,后台设置了上限,获取使用代理IP数量超额后在日志中会有提示,正常情况合成几万字是没有问题的!有更高使用需求的朋友可以联系QQ:5071698,可为指定账号单独购买不重复代理IP。

  • 微软APIkey:使用微软Azure接口时,勾选生效,需要自行申请注册微软Azure TTS服务apikey,点击观看视频教程,区域选择一定不能错,错了无法获取token,提示:最好不要在某宝等平台购买此apikey,群里已经有N例了,用着用着莫明其妙就失效,无法获取token,如果你是从某宝购买的apikey,在选择了对应区域后还是一直获取token失败,那恭喜你,中招了!

  • 火山TTS:需要自行注册并开通【语音合成】服务,点击观看视频教程,注册开通后,如下图所示获取并填写AppID/Token

  • OpenAI APIKEY:填写OpenAI官方APIKEY,OpenAI API代理(可选):自建或其它Openai API代理转发接口,Proxy(可选):填写不受限的Http代理,格式(ip:port),例:xxx.xxx.xxx.xxx:xxx,或者使用不受限的全局代理OpenAI新注册账号已经没有5$赠送金额了
  • 运行日志:日志信息,出现问题方便定位。

 


常见问题 & 注意事项

1、路径问题

上图可以看到,当前程序路径即为软件所在目录的完整路径,在此完整路径中,不能有空格或是英文小括号等特殊字符,它们会导致TTS语音合成后无法进行最终合并;

解决办法:将ztj-tts文件夹剪切到其它盘符的根目录下,确保ztj-tts所在文件夹名称中不包括空格或英文小括号等特殊字符即可。

2、权限问题

问题表现:文件无法拖放/音频合成完成后无法合并/勾选删除分段音频无法删除等等;

解决方法:可以尝试把各类电脑管家/杀毒软件关闭,再使用管理员权限运行MS-TTS(不要使用快捷方式),如果有弹出对话框询问是否允许之类的提示,记得一定要允许!!!

3、误杀问题

问题表现:ZTJ-TTS压缩包下载后一解压就被删了,或者用着用着就没了;

解决办法:关闭win10以上系统文件实时保护功能(Windows安全中心--病毒和威胁防护--“病毒和威胁防护”设置--管理设置--实时保护--关闭)、关闭杀毒软件(原因是软件有加密保护,会造成杀毒软件误杀);

4、合成失败问题

  • 1、超长文本需要要注意文本所在路径以及文本文件名称,两者都尽量不要包含特殊字符如英文括号空格等;
  • 2、中小文件合成时,需要检查文本内容是否包含特殊字符,特别需要警惕那些看起来像空格的不可见字符,因为很多特殊符号肉眼看起来非常像是空格,但实际上它是特殊符号,推荐使用notepad等文本编辑工具进行查看编辑删除;
  • 3、超长文本合成音频前,除了确保合成内容中无特殊符号外,还需要注意导入的文本文件所在路径以及txt文本文件名称,两者都不要包含特殊字符(如括号空格等),它们可能导致合成失败;
  • 小技巧:如何快速分辨是文件名/路径导致的合成失败还是文本内容有问题导致的合成失败:如果是文件名或路径问题,那么日志窗口在显示提交合成文本后就没有后续了,如果是文本内容有问题,那么日志窗口提交文本后会有相应错误提示的,通过这一点就可以快速分辨是路径、文件名问题还是文本内容问题;

5、无法下载问题:Microsoft Edge 阻止不安全的下载

解决办法:

 


更新日志

v1.0.6.5

  • 1、增加:文本转语音最终合并阶段增加音频文件fileSize显示;

v1.0.6.4

  • 1、修复:微软接口SRT字幕配音自动调节功能;

v1.0.6.3

  • 1、优化:微软接口SRT字幕配音功能;
  • 2、增加:微软接口小辰新风格(实时广告);
  • 3、优化:后端登录验证系统逻辑;

v1.0.6.2

  • 1、增加:OpenaiAPI自定义代理设置;
  • 2、优化:微软新角色导出srt功能;

v1.0.6.0

  • 1、修复:新增共享代理线路BUG。

v1.0.5.9

  • 1、优化:使用VIP共享代理不成功不计数。

v1.0.5.8

  • 1、增加:VIP共享代理线路2;
  • 2、优化:VIP共享代理线路合成逻辑,提高代理合成成功率。

v1.0.5.7

  • 1、优化:音频合并逻辑;
  • 2、共享线路代理IP模块更新;

v1.0.5.6

  • 修复:srt字幕合成音频问题

v1.0.5.5

  • 1、微软接口添加9个新角色:中文:晓晓-New,英语:Ava、Andrew、Emma、Brian,德语:Florian、Seraphina,法语:Remy、Vivienne

v1.0.5.4

  • 1、优化:TTS最终合成音频质量与设定音频质量保持一致!
  • 2、修复:分段音频合并数量设置无效bug;

v1.0.5.3

  • 1、修复:火山TTS接口选择高音质选项无法最终合并bug!

v1.0.5.2

  • 1、增加:Edge接口导出Srt增加m2新模式,导出字幕更稳定,缺点速度较m1模式慢;
  • 2、优化:Edge接口合成错误重试机制;

v1.0.5.1

  • 1、修复无多处登录频繁跳出问题;

v1.0.5.0

  • 1、网站因安全问题进行更新升级,此次更新为软件登录模块的同步更新!届时,所有版本号低于v1.0.5.0版本将因网站更新升级,登录接口失效从而无法登录使用!

v1.0.4.9

  • 1、修复:bug修复;

v1.0.4.8

  • 1、增加:重新设计增加换行间隔功能;
  • 2、其它细节调整优化;

v1.0.4.7

  • 1、修改:移除换行间隔,此功能与其它功能存在冲突;
  • 2、修复:多角色配音文本分隔算法重写,解决多角色配音乱序问题;
  • 3、界面微调:日志窗口可在设置界面单独开启关闭;
  • 4、其它细节调整优化;

v1.0.4.6

  • 1、增加:微软免费接口VIP共享代理增加额度提示;
  • 2、增加:可单独购买代理IP,详情见网站文档说明;

v1.0.4.5

  • 1、增加:微软免费接口增加VIP共享代理;
  • 2、修改:移除某果代理,修改为更灵活的自定义HTTPS或socks5代理;

v1.0.4.4

  • 修复:部分场景多角色无法合成bug;

v1.0.4.3

  • 修复:部分场景导出字幕文件产生多余空行问题;

v1.0.4.2

  • 修复:部分场景下中小文本合成成功无音频文件bug;

v1.0.4.1

  • 修复:edge接口合成提前完成问题;

v1.0.4.0

  • 1、增加:ms、火山tts增加全局换行符指定间隔;
  • 2、修复:edge接口试听完成后按钮无法恢复问题;
  • 3、调整:为避免可能出现的问题将火山tts接口调整到最后;
  • 4、其它部分细节调整;

v1.0.3.9

  • 1、修复:微软接口导出SRT或设置全局间隔时合成音频偶尔出现不正常断句问题;
  • 2、修复:合成音频添加背景音乐后音频质量下降问题;
  • 3、优化:Edge接口文本转语音功能优化,增加合成速度,解决部分卡顿问题;
  • 4、文本转语音导出SRT功能单次字符数量不得超过20000(暂定);

v1.0.3.8

  • 1、修复:微软免费接口Srt字幕配音Err400问题;
  • 2、增加:合成音频添加指定/随机背景音乐功能;

v1.0.3.7

  • 1、解决微软免费接口音质限制导致无法合成问题(后续使用微软免费接口时选择音质不再生效,使用官方APIKEY不受影响);

v1.0.3.6

  • 1、增加:Edge接口文本合成增加导出Srt字幕功能;

v1.0.3.5

  • 1、增加:OpenAi文本转语音接口(需OpenAI的ApiKey及相应的魔法环境);
  • 2、修复:更换获取公网IP接口,解决使用某果代理无法查询添加白名单问题;
  • 3、其它:部分细节调整优化;

v1.0.3.4

  • 1、修复:英文角色活力女生数据错误;
  • 2、修改:火山角色数据改为动态获取,方便后续增删修改;
  • 3、火山接口增加角色擎苍v2;

v1.0.3.3

  • 1、修复:合成结束无音频问题;
  • 2、修复:保存配置错误问题;

v1.0.3.2

  • 1、调整:取消MS接口429错误超过5次停止;
  • 2、增加:MS接口APIkey区域保存;
  • 3、增加:火山TTS接口(支持文本/Srt转语音、导出SRT)
  • 4、优化部分功能执行逻辑;

v1.0.3.1

  • 1、调整:取消连接4秒超时设定;
  • 2、修改:从此版本起取消强制更新(注意:v1.0.3.1以前老版本不可用,1.0.3.1及后续版本可选择不更新,且可使用)

v1.0.3.0

  • 1、修复:微软接口无法导出字幕问题;

v1.0.2.9

  • 1、修复:Edge接口试听问题;
  • 2、修改:设置界面选择保存文件夹时优先打开当前目录;

v1.0.2.8

  • 1、修复:Edge合成频繁内存错误;

v1.0.2.7

  • 1、异常报错失去响应问题;

v1.0.2.6

  • 1、Edge接口整体调整优化,大幅提高合成稳定性;
  • 2、Edge接口增加跳过已完成片段功能;

v1.0.2.5

  • 1、修复:ApiKey区域获取token失败问题;

v1.0.2.4

  • 1、增加:ApiKey区域选择(注意:如果ApiKey区域选择错误,会一直显示获取token/获取token失败);
  • 2、任务结束不提示问题;

v1.0.2.3

  • 1、增加:对使用ApiKey模式合成音频进行校验,防止缺漏;
  • 2、部分逻辑优化;

v1.0.2.2

  • 1、修复:字幕配音批量执行bug;
  • 2、newMode启用开放测试时间段,详情见网页说明;

v1.0.2.1

  • 1、修复:newMode长文本合成428问题;

v1.0.2.0

  • 1、增加:设置页面增加新合成模式,尝试解决429问题;
  • 2、修改:AI语音识别导入方式,支持指定目录批量识别;
  • 3、删除:合成间隔相关设置(无意义);

v1.0.1.9

  • 1、修复:多角色顺序错乱问题;

v1.0.1.8

  • 1、修复:插入间隔不生效问题;

v1.0.1.7

  • 1、增加:多角色导出Srt字幕功能;
  • 2、修改:间隔休息在使用代理或APIKEY时不启用;

v1.0.1.6

  • 1、修复多角色合成乱序丢角色问题;
  • 2、修复角色列表单角色保存后无法载入问题;

v1.0.1.5

  • 1、增加接收音频数据校验,防止音频短缺;
  • 2、修复多角色合成顺序问题;

v1.0.1.4

  • 1、增加某象隧道代理动态转发接口;

v1.0.1.3

  • 1、增加某果隧道代理动态转发接口;
  • 2、修复使用微软APIkey无法设置风格问题;

v1.0.1.2

  • 1、增加MS免费接口发送请求自定义间隔;

v1.0.1.1

  • 1、修复使用apikey时多角色状态内容重复问题;

v1.0.1.0

  • 1、增加Whisper AI语音识别功能;
  • 2、修复使用微软APIKey Token时效性问题;

v1.0.0.9

  • 1、增加多角色数据保存功能;
  • 2、增加运行日志导出/清空菜单功能(鼠标右键);
  • 3、中小文本编辑区增加清空菜单;
  • 4、所有右键菜单增加图标;

v1.0.0.8

  • 1、增加微软Azure官方API接口(需自行注册申请AzureTTS服务apikey,地区选择:东亚);
  • 2、部分逻辑优化;

v1.0.0.7

  • 1、ms接口增加插入间隔功能(中小文本编辑区--鼠标右键--插入间隔);
    • 注意:插入间隔只支持MS接口文本合成,不支持导出SRT字幕模式下进行自定义间隔,导出字幕时文本内容进行自定义间隔会导致合成失败;
  • 2、部分代码逻辑优化;

v1.0.0.6

  • 1、修复多角色配音bug

v1.0.0.5

  • 1、对导出srt模式下TTS音频衔接进行细微调整;
  • 2、增加过滤几组已知特殊字符串。

v1.0.0.4

  • 1、修复部分特殊字符造成无法导出SRT问题;
  • 2、修复部分场景下无法删除音频片段问题;

v1.0.0.3

  • 1、修复文本合成导出srt吃字头问题;
  • 2、增拼音查询功能;

v1.0.0.2

  • 1、修复原始文件名命名带路径问题;
  • 2、增加SRT(MS/Edge)字幕配音功能;
  • 3、部分功能优化调整;

v1.0.0.1

  • 1、增加多音字替换功能;
  • 2、增加超长文本合成音频使用原始文件名命名功能;
  • 3、增加TXT文本拖拽导入功能;
  • 4、处理回车换行内容连续问题:
    • 注意:不建议使用回车换行取代标点符号,因为工具所有的文本分隔都是基于标点符号进行的,大量使用回车换行取代标点符号有可能导致合成出错!
  • 5、文本合成、导出SRT部分流程梳理、优化;

v1.0.0.0

  • 1、实现MS/Edge接口中小/超大文本合成;
  • 2、实现MS接口文本合成导出SRT字幕;
本站所有资源版权均属于原作者所有,这里所提供资源均只能用于参考学习使用,请在下载后24小时内删除,严禁商用。若由于商用引起版权纠纷,一切责任均由使用者承担。