关于微软Azure免费TTS接口说明:

一、2023.10.25下午开始,微软官方对TTS免费接口合成次数进行了限制,每日合成上限为20次,此限制是基于当前机器公网IP地址,问题表现一直合成失败429("code":"TooManyRequests","message":"The rate limit has been reached. The timeout in seconds can be found in the Retry-After header."),当合成次数达到上限后,此公网IP就需要等待24小时后才可以继续合成,应对策略:

  • 1、使用微软接口VIP线路普通用户5000字符/天网站VIP用户50000字符/天试听免费不计额度(使用VIP线路时日志窗口会有额度信息显示),
  • 2、有条件也可自行申请使用官方的apikey,官方Apikey免费额度为每月50W字符(汉字约25W字符)(点击观看视频教程),注意:微软官方是以token计量
  • 3、自行购买HTTPS/SOCKS5代理,可绕过此限制,前提:要求代理节点IP够多,够干净,否则用的人多了,很快就会被大范围限制;
  • 4、临时应急可以通过使用全局代理切换公网IP,如果是家庭环境,则可以通过重新拔号上网达到切换公网IP的目的,如果可以连接手机热点,则可以通过手机端开启/关闭飞行模式达到切换公网IP的目的(注意:公网IP资源有限,并不是说你切换了一个新的公网IP就一定可以合成20次,可以合成20次的前提是,你拿到的这个公网IP在你之前24小时内,没有被别人用于微软TTS合成,如果这个公网IP被别人拿去合成过,那20次用一次就少一次,如果被别人把20次用完,你直接就会是429;

二、2023.12.8日傍晚开始,微软TTS免费接口对TTS合成音频音质进行了限制,目前仅支持24khz-16bit音质,后续ZTJ-TTS中使用微软TTS免费接口时,音质选项将不再生效,使用微软官方APIKEY不受此影响;


前情:

  • 1、ZTJ-TTS软件账号密码即为本网站用户账号密码;
  • 2、本网站VIP用户即为ZTJ-TTS工具VIP用户,本网站非VIP用户即为ZTJ-TTS普通用户;

当前版本:

v1.0.9.3

  • 1、修复:隐藏bug,可能导致内容缺失;
  • 注意:v1.0.9.1版本起,因角色数据更新,角色ID顺序会有所变化,如果有保存多角色数据,请清除角色数据后重新设置保存!!!

友情提示:

  1. ZTJ-TTS为全新版本TTS文本转语音工具,开发定位为网站VIP福利!本工具所有功能有文档,有视频,简单问题请自行查阅学习,BUG或意见建议请加群按照提交规则进行反馈,使用本工具不提供任何1对1解答服务!!!
  2. 问题反馈:点击软件左下角添加Q群提交,提交bug请按照群文件内bug提交规则进行,非此Q群内提交未按照Q群内bug提交规则提交概不处理!!!
  3. 非VIP用户仅开放基本TTS合成功能,且合成内容有长度限制,无次数限制!
  4. 首次使用,请仔细阅读以下文档/视频,磨刀不误砍柴功!

主要功能:

文本转语音(微软Azure免费/收费接口/Edge接口/火山TTS接口/OpenAI TTS接口)、Srt字幕编辑、Srt字幕合成语音、AI语音识别导出srt、txt、vtt、lic


界面

 


视频教程


文字教程

1、接口

  • 微软Azure:支持文本配音、导出Srt字幕、Srt字幕配音,同时支持使用官方API(需要自行申请注册 Azure TTS 服务 apikey)

  • Edge朗读:支持文本配音、Srt字幕配音

  • 火山TTS:支持文本配音、导出Srt字幕、Srt字幕配音(需要自行申请注册申请Apikey)

  • OpenAI TTS:支持文本配音(需要Apikey)

2、角色

  • 当前角色(旁白角色)

    合成文本不进行角色设置时,将直接使用此处角色进行TTS语音合成,如果合成文本中存在角色设置,则对文本中所有没有指定角色的文本使用此处角色进行配音,和旁白的类似

  • 角色列表

    文本配音时有多角色需求时,可以先在当前角色区域将所需要的角色参数调整设置好,然后点击[添加]按钮,即可将此角色加入角色列表,加入角色列表后,才可以在右侧文本编辑区域进行角色设置,角色列表最多支持50个角色。

  • 保存角色数据

    • 在多角色列表区域点击鼠标右键,弹出菜单--保存 即可,需要使用时,同样在多角色列表区域点击鼠标右键,弹出菜单--载入 即可

 

3、文本配音

3.1、中小文本

  • 角色试听

    以左侧当前角色设置参数试听当前文本内容,支持选择指定文本试听;

  • 设置角色

    使用此功能需要在左侧列表先添加角色,然后使用指定角色对选中范围文本内容进行标记,进行过角色标记的内容在后面进行语音合成时,将以指定的角色设置进行语音合成。

    使用方法:在中小文本编辑区域,选择要指定角色的文本内容,鼠标右键--设置角色--选择左侧角色列表中添加好的指定角色即可。

    注意:不支持角色嵌套,如果存在角色嵌套会导致无法合成(角色嵌套是指在已指定角色的文本中再次指定其它角色)

    角色嵌套示例:{R云健(男性)(1)|xxx{R晓辰(女性)(0)|xxxxxxxxxxxxxxxR}xxxR}

  • 插入间隔

    在当前光标位置插入指定时长间隔,单位为毫秒(ms),1000ms=1秒(注意:Edge接口不支持插入间隔功能)

3.2、超大文本
  • 支持文件格式:编码格式为utf8的txt文档,非utf8编码将显示编码错误

    image-20230927102814577

  • 导入方法

    • 拖放:选择需要导入的txt文件,直接拖到软件界面导入

    • 超大文本表格区域鼠标右键--导入,选择文件完成导入

  • 不限制文件大小

    • 小提示:通常情况下,20000字符中文内容,合成音频后的时长约为2小时(120分钟)左右,以此类推,10000字符中文内容长度合成音频时长约为1小时左右,1600字符中文内容合成音频时长约为10分钟。

3.3、全局间隔

全局间隔,主要用于一键设置全文所有语句间隔停顿时间,勾选启用。

3.4、导出Srt字幕

文本配音时是否同步导出Srt字幕,勾选启用。

导出模式:

m1模式:纯算法本地实现,有概率生成失败为确保成功率和准确率,使用此功能时单次字符数量不得超过25000注意:普通文本配音与导出Srt字幕m1模式的文本配音是两种截然不同的模式,合成效果也会有所不同,另外导出Srt字幕模式的文本配音不支持自定义插入间隔,两者有冲突,有可能造成合成失败。另外,m1模式导出Srt字幕时根据角色语速不同,需要对全局间隔参数进行微调,具体的全局间隔数值需要自己进行耐心调校测试,否则生成效果可能会不尽人意。

m2模式:服务器远程AI识别生成字幕,优点:成功率高,支持最长不超过3小时音频生成字幕,缺点:由于是AI识别生成,可能有少量字幕内容音对字不对。

3.5、多音字
  • 直接使用拼音替代

    使用查拼音功能查完后,将文本中需要指定音调的多音字使用查询到的指定音调的拼音替换

  • 编辑替换多音字列表

设置选项--编辑替换多音字列表--弹出窗口,输入原始多音字英文逗号替换的同音字,一行一个,如上图所示,编辑完成后,点击确定即可

注意:此处将直接对合成文本中的多音字进行全局替换,所以使用多音字替换后,导出Srt时,需要对导出的Srt中的多音字文本进行手动还原。

4、字幕配音

4.1、字幕编辑

字幕编辑表格区域点击鼠标右键--导入,导入需要编辑的Srt字幕文件,导入完成后就可以开始修改,修改完成后,点击鼠标右键--保存,即可将修改后的srt进行保存

4.2、字幕配音

  • 导入:导入字幕,或者直接将Srt字幕文件拖动到软件界面完成导入

  • 清空:清空列表

注意:!!!

根据Srt字幕内容进行配音,需要注意,此模式对Srt字幕文件合理性要求较高,所谓字幕文件合理性,是指逐条字幕内容与其所对应的时间轴是否匹配,简单举例:

5
00:00:12,381 --> 00:00:14,109
这就是为什么我们将选项放在一起的原因让您了解我们的指南

以上是字幕文件中的一组字幕数据,含义如下:

序号

字幕开始时间:00:00:12,381 --> 字幕结束时间:00:00:14,109

字幕内容:这就是为什么我们将选项放在一起的原因让您了解我们的指南

空行结束

以上是一条标准的SRT字幕格式,包含序号、字幕开始/结束时间、字幕文本内容、空行结束,缺一不可!

通过简单计算可获取此条字幕内容显示的时间=结束时间(14.109)-开始时间(12.381)=1.728(秒)

这就是非常典型不合理的字幕文件,因为正常情况下,这么长的一段字幕内容,完整表述所需的时间绝对不止1.728秒,

如果你的字幕文件存在类似于这种不合理的时间轴,软件为了准确对齐时间轴,就只能对这段内容的音频进行加速处理,以缩短这条字幕音频的时长,让其小于1.728秒,如果不对这段字幕对应的音频进行加速处理,那么这条音频就无法在时间轴指定的时间内播放完成,它就会直接影响下一条字幕,造成尾压头声音重叠的问题。

总结:如果你在进行Srt字幕配音时,发现最终音频中时不时有语句突然加速的现象,那么,请参照上述内容,自行手动调整加速语句对应Srt字幕文件时间轴,以确保其合理性。

小提示:这种问题通常都是对字幕文件进行翻译以后出现,原因就是原始字幕文件的时间轴使用原始语言是合理的,经过翻译后同样一句话,内容长度会发生变化,而此时时间轴没变,这才是根源。

5、语音识别

注意:模型下载完成后需要移动到软件目录下的whisper文件夹中

  • 1、选择音视频目录:选择需要进行语音识别的音视频文件保存目录,软件将对指定目录下所有*.mp4/*.mp3/*.wav文件进行批量AI语音识别;
  • 2、选择语音:选择音视频文件的语言类型,zh:中文,en:英文,找不到或是不知道就保持默认:auto即可。
  • 3、选择模型:模型越大,需要内存越大,识别结果越准确,识别时间也会越长,点此下载模型文件

    • 所有模型共分五个档次,从小到大分别为:tiny、base、small、medium、large
    • 模型越大,需要内存越多,识别结果相对越准确,语音识别需要的时间也会越长,
    • 模型命名:每1档模型又分为4个型号,以base模型为例:
      • base.bin:基础模型,适合处理多种语言的语音识别任务。这个模型体积适中,性能较为平衡,适合在多语言场景下使用。
      • base-q5_1.bin:base 模型的量化版本,q5_1 表示使用了一种特定的量化方案,在保持较好准确率的同时显著减少了模型的体积,适合在资源有限的设备上运行。
      • base.en.bin:基于 base 模型专门为英文语音识别优化的版本。相比于多语言版本,它可能在处理英文语音时性能更好,识别准确率更高。
      • base.en-q5-1.bin:base.en 模型的量化版本,q5_1 表示使用了一种特定的量化方案,在保持较好准确率的同时显著减少了模型的体积,适合在资源有限的设备上运行。
    • 请结合自身需求选择下载合适的模型。
  • 4、输出文件:识别出的文本内容保存格式,当前支持输出 txt/srt/vtt/lrc 格式,识别成功后,输出文本文件保存在音视频文件相同目录且名称相同。
  • 5、启用GPU加速(需要有显卡,其次需要安装显卡对应版本的CUDA,这块坑比较多,大家自行查阅相关资料)

设置选项

 

  • 微软TTS线路测试:免费线路延迟测试(通常情况下,晚上是使用高峰期,此时免费接口服务器响应会变慢,甚至无响应,导致合成失败)

  • 保存目录:TTS合成音频保存目录

    • 打开:打开保存目录

    • 选择文件夹:选择音频保存目录

  • 超大文本合成音频使用原始文件名命名:在超长文本模式下生效,勾选后,最终合并音频文件名以“原始导入文本文件名_All”进行命名

  • 合成结束打开保存目录:在语音合成任务完成后打开保存目录(如果保存文件夹已经有打开则不会再打开)

  • 合成结束是否播放提示音:勾选播放,不勾选不播放

  • 分段音频合并数量:在进行超长文本合并时,如果将所有音频进行完整合并,最终生成的音频文件将会非常大,动辙几GB,于是采取了二级合并的模式,可以自行根据需求按指定数量合并(如果还是不能理解,打个比方,你的文本合成音频后,有300个音频文件,如果对这300个音频文件进行完整合并,最终合成的文件只有一个,且文件大小将会达到几GB,不方便移动传输,且合成时’E9会非常长,现增加的二级合并,意思就是按照指定的数量对前面生成的300个文件进行合并,比如默认二级合并数量50,意思就是以50个音频为一组,对前面的300个音频进行分开合并,这样300个音频文件合成完成后,就会生成6个二级合并的音频文件,每个二级合并音频文件大小就会降到几百MB)

  • 是否进行最终完整合并:就是将所有分段音频文件合并成一个音频文件。

  • 合成结束添加背景音乐:TTS语音合成完成后,自动添加指定/随机随机音乐,
    • 添加指定背景音乐,点击按钮弹出音频文件选择窗口,选择相应的背景音乐即可;
    • 添加随机背景音乐,在第一次弹出的音频选择窗口点击“取消”,然后软件会自动进入文件夹浏览选择窗口,选择背景音乐所在文件夹后确定即可。
    • 循环:勾选后,当TTS语音时间很长,而背景音乐时长较短时,会重复循环播放背景音乐,直到TTS音频结束,不勾选时,背景音乐播放一次就会结束播放;
  • 自定义代理:

解决微软免费接口访问速率限制(429问题),使用方法:设置代理的IP地址和端口后,选择相应的代理类型,最后勾选上面的启用即可。

  • 微软接口VIP线路:后端采用APIKey形式,全面解决微软免费接口访问速率限制(429问题)
    • VIP用户每天50000字符!有更高使用需求的朋友可为指定账号单独购买更高额度套餐。详情:https://ztjun.fun/2323.html
  • 微软APIkey:使用微软Azure接口时,勾选生效,需要自行申请注册微软Azure TTS服务apikey,点击观看视频教程,区域选择一定不能错,错了无法获取token,提示:最好不要在某宝等平台购买此apikey,群里已经有N例了,用着用着莫明其妙就失效,无法获取token,如果你是从某宝购买的apikey,在选择了对应区域后还是一直获取token失败,那恭喜你,中招了!

  • 火山TTS:需要自行注册并开通【语音合成】服务,点击观看视频教程,注册开通后,如下图所示获取并填写AppID/Token

  • OpenAI APIKEY:填写OpenAI官方APIKEY,OpenAI API代理(可选):自建或其它Openai API代理转发接口,Proxy(可选):填写不受限的Http代理,格式(ip:port),例:xxx.xxx.xxx.xxx:xxx,或者使用不受限的全局代理OpenAI新注册账号已经没有5$赠送金额了
  • 运行日志:日志信息,出现问题方便定位。

 


常见问题 & 注意事项

1、路径问题

上图可以看到,当前程序路径即为软件所在目录的完整路径,在此完整路径中,不能有空格或是英文小括号等特殊字符,它们会导致TTS语音合成后无法进行最终合并;

解决办法:将ztj-tts文件夹剪切到其它盘符的根目录下,确保ztj-tts所在文件夹名称中不包括空格或英文小括号等特殊字符即可。

2、权限问题

问题表现:文件无法拖放/音频合成完成后无法合并/勾选删除分段音频无法删除等等;

解决方法:可以尝试把各类电脑管家/杀毒软件关闭,再使用管理员权限运行(不要使用快捷方式),如果有弹出对话框询问是否允许之类的提示,记得一定要允许!!!

3、误杀问题

问题表现:ZTJ-TTS压缩包下载后一解压就被删了,或者用着用着就没了;

解决办法:关闭win10以上系统文件实时保护功能(Windows安全中心--病毒和威胁防护--“病毒和威胁防护”设置--管理设置--实时保护--关闭)、关闭杀毒软件(原因是软件有加密保护,会造成杀毒软件误杀);

4、合成失败问题

  • 1、超长文本需要要注意文本所在路径以及txt文本文件名称,两者都尽量不要包含特殊字符如英文括号/空格等,它们可能导致合成失败;
  • 2、中小文件合成时,需要检查文本内容是否包含特殊字符,特别需要警惕那些看起来像空格的不可见字符,因为很多特殊符号肉眼看起来非常像是空格,但实际上它是特殊符号,推荐使用notepad等文本编辑工具进行查看编辑删除;
  • 小技巧:如何快速分辨是文件名/路径导致的合成失败还是文本内容有问题导致的合成失败:如果是文件名或路径问题,那么日志窗口在显示提交合成文本后就没有后续了,如果是文本内容有问题,那么日志窗口提交文本后会有相应错误提示的,通过这一点就可以快速分辨是路径、文件名问题还是文本内容问题;

5、无法下载问题:Microsoft Edge 阻止不安全的下载

解决办法:

6、常见错误码

  • -1/-3:网络不稳定,连接超时;

  • -2:网络问题缺失数据,校验未通过;

  • 200:请求成功;

  • 400[ms/edge]:合成文本内存在特殊字符,请检查去除后再试;

  • 429[ms]:当前IP已达到合成上限;

  • 3010[hs]:文本长度超限;

  • 3011[hs]:无效文本;

 


更新日志

V1.0.9.3

  • 1、修复:隐藏bug,可能导致内容缺失;

V1.0.9.2

  • 1、更新:Edge接口解决Sec-MS-GEC参数,恢复正常使用;

V1.0.9.1

  • 1、更新:微软接口角色同步官方最新角色数据;
  • 2、优化:UI界面部分细节调整,角色列表数据更清晰;
  • 注意:因角色数据更新,角色ID顺序会有所变化,如果有保存多角色数据,请清除角色数据后重新设置保存!!!

V1.0.9

  • 1、移除EdgeTTS接口:EdgeTTS官方对国区EdgeTTS接口增加了限制,所有使用EdgeTTS接口的第三方工具已全部失效!
  • 2、更新:日志显示及保存格式;

v1.0.8.9

  • 1、增加:登录完成后日志窗口增加用户组【普通用户/网站VIP】显示;
  • 2、升级:文本合成导出字幕m2模式升级为服务端AI识别生成,识别字幕音频最长不超过3小时;

v1.0.8.8

  • 1、修复:部分特殊场景合成失败问题及几处隐藏bug;
  • 2、增加:自助开通微软接口VIP线路;

v1.0.8.7

  • 1、更新:AI语音识别功能升级(支持x86系统、支持GPU加速(需要安装CUDA)、增加模型);
  • 2、增加:换行间隔支持Linux系统文本换行(LF)模式;
  • 注意:此版本支持库文件有更新,请下载使用完整版本。

v1.0.8.4

  • 1、修复:一台机器同时运行多个实例相互影响问题;
  • 2、修复:微软接口VIP线路试听错误问题;
  • 3、增加:运行日志文件自动保存到log目录下,方便上传反馈 ;

v1.0.8.1

  • 1、修复:微软接口TTS合成结尾丢字问题;

v1.0.8.0

  • 1、增加:微软接口VIP线路增加2台服务器线路,加快合成速度;

v1.0.7.9

  • 1、增加:微软接口同步更新增加4个新角色(云逸、云杰、晓宇、云奇);
  • 2、修复:指定文件、目录字符清理点击按钮无效问题;
  • 3、优化:部分逻辑优化;

v1.0.7.7

  • 1、升级:微软TTS合成升级为多线程,当前阶段为保证稳定使用,暂开2个线程;
  • 2、修复:微软TTS合成导出Srt时文本内容超过一定长度导出失败问题;
  • 3、优化:SRT字幕配音功能将对字幕文件可能存在的空字幕情况自动进行处理;

v1.0.7.6

  • 1、优化:Edge接口TTS合成报内存错误问题;
  • 2、增加:开放普通用户微软接口VIP线路使用权限,可进行少量文本试听、合成;
  • 3、删除:移除微软接口VIP线路2(代理IP);

v1.0.7.5

  • 1、修复:微软接口VIP线路一批量合成时的字符计数BUG;

v1.0.7.1

  • 1、修改:微软接口VIP线路1改造,普通VIP用户合成30000字符/天,合成不成功不计数;
  • 注意:后续将取消VIP线路代理IP形式,全部改为字符额度,已购买代理IP用户可继续使用至套餐结束;

v1.0.7.0

  • 1、优化:微软、edge接口文本配音导出字幕、字幕配音功能;
  • 2、修复:几个小bug;

v1.0.6.9

  • 1、增加:批量文本处理功能;
  • 2、优化:微软TTS新角色SRT配音;
  • 3、修复:Edge接口遇到网络问题导致提前合并bug;
  • 4、修复:AI语音识别无反应bug;

v1.0.6.8

  • bug修复;

v1.0.6.7

  • bug修复;

v1.0.6.6

  • 1、增加:中小文本特殊字符清理功能(中小文本框内鼠标右键-文本清理);
  • 2、优化:微软、Edge、火山文本合成导出SRT功能,提高成功率;
  • 3、增加:合成音频增加指定片头音乐功能;

v1.0.6.5

  • 1、增加:文本转语音最终合并阶段增加音频文件fileSize显示;

v1.0.6.4

  • 1、修复:微软接口SRT字幕配音自动调节功能;

v1.0.6.3

  • 1、优化:微软接口SRT字幕配音功能;
  • 2、增加:微软接口小辰新风格(实时广告);
  • 3、优化:后端登录验证系统逻辑;

v1.0.6.2

  • 1、增加:OpenaiAPI自定义代理设置;
  • 2、优化:微软新角色导出srt功能;

v1.0.6.0

  • 1、修复:新增共享代理线路BUG。

v1.0.5.9

  • 1、优化:使用VIP共享代理不成功不计数。

v1.0.5.8

  • 1、增加:VIP共享代理线路2;
  • 2、优化:VIP共享代理线路合成逻辑,提高代理合成成功率。

v1.0.5.7

  • 1、优化:音频合并逻辑;
  • 2、共享线路代理IP模块更新;

v1.0.5.6

  • 修复:srt字幕合成音频问题

v1.0.5.5

  • 1、微软接口添加9个新角色:中文:晓晓-New,英语:Ava、Andrew、Emma、Brian,德语:Florian、Seraphina,法语:Remy、Vivienne

v1.0.5.4

  • 1、优化:TTS最终合成音频质量与设定音频质量保持一致!
  • 2、修复:分段音频合并数量设置无效bug;

v1.0.5.3

  • 1、修复:火山TTS接口选择高音质选项无法最终合并bug!

v1.0.5.2

  • 1、增加:Edge接口导出Srt增加m2新模式,导出字幕更稳定,缺点速度较m1模式慢;
  • 2、优化:Edge接口合成错误重试机制;

v1.0.5.1

  • 1、修复无多处登录频繁跳出问题;

v1.0.5.0

  • 1、网站因安全问题进行更新升级,此次更新为软件登录模块的同步更新!届时,所有版本号低于v1.0.5.0版本将因网站更新升级,登录接口失效从而无法登录使用!

v1.0.4.9

  • 1、修复:bug修复;

v1.0.4.8

  • 1、增加:重新设计增加换行间隔功能;
  • 2、其它细节调整优化;

v1.0.4.7

  • 1、修改:移除换行间隔,此功能与其它功能存在冲突;
  • 2、修复:多角色配音文本分隔算法重写,解决多角色配音乱序问题;
  • 3、界面微调:日志窗口可在设置界面单独开启关闭;
  • 4、其它细节调整优化;

v1.0.4.6

  • 1、增加:微软免费接口VIP共享代理增加额度提示;
  • 2、增加:可单独购买代理IP,详情见网站文档说明;

v1.0.4.5

  • 1、增加:微软免费接口增加VIP共享代理;
  • 2、修改:移除某果代理,修改为更灵活的自定义HTTPS或socks5代理;

v1.0.4.4

  • 修复:部分场景多角色无法合成bug;

v1.0.4.3

  • 修复:部分场景导出字幕文件产生多余空行问题;

v1.0.4.2

  • 修复:部分场景下中小文本合成成功无音频文件bug;

v1.0.4.1

  • 修复:edge接口合成提前完成问题;

v1.0.4.0

  • 1、增加:ms、火山tts增加全局换行符指定间隔;
  • 2、修复:edge接口试听完成后按钮无法恢复问题;
  • 3、调整:为避免可能出现的问题将火山tts接口调整到最后;
  • 4、其它部分细节调整;

v1.0.3.9

  • 1、修复:微软接口导出SRT或设置全局间隔时合成音频偶尔出现不正常断句问题;
  • 2、修复:合成音频添加背景音乐后音频质量下降问题;
  • 3、优化:Edge接口文本转语音功能优化,增加合成速度,解决部分卡顿问题;
  • 4、文本转语音导出SRT功能单次字符数量不得超过20000(暂定);

v1.0.3.8

  • 1、修复:微软免费接口Srt字幕配音Err400问题;
  • 2、增加:合成音频添加指定/随机背景音乐功能;

v1.0.3.7

  • 1、解决微软免费接口音质限制导致无法合成问题(后续使用微软免费接口时选择音质不再生效,使用官方APIKEY不受影响);

v1.0.3.6

  • 1、增加:Edge接口文本合成增加导出Srt字幕功能;

v1.0.3.5

  • 1、增加:OpenAi文本转语音接口(需OpenAI的ApiKey及相应的魔法环境);
  • 2、修复:更换获取公网IP接口,解决使用某果代理无法查询添加白名单问题;
  • 3、其它:部分细节调整优化;

v1.0.3.4

  • 1、修复:英文角色活力女生数据错误;
  • 2、修改:火山角色数据改为动态获取,方便后续增删修改;
  • 3、火山接口增加角色擎苍v2;

v1.0.3.3

  • 1、修复:合成结束无音频问题;
  • 2、修复:保存配置错误问题;

v1.0.3.2

  • 1、调整:取消MS接口429错误超过5次停止;
  • 2、增加:MS接口APIkey区域保存;
  • 3、增加:火山TTS接口(支持文本/Srt转语音、导出SRT)
  • 4、优化部分功能执行逻辑;

v1.0.3.1

  • 1、调整:取消连接4秒超时设定;
  • 2、修改:从此版本起取消强制更新(注意:v1.0.3.1以前老版本不可用,1.0.3.1及后续版本可选择不更新,且可使用)

v1.0.3.0

  • 1、修复:微软接口无法导出字幕问题;

v1.0.2.9

  • 1、修复:Edge接口试听问题;
  • 2、修改:设置界面选择保存文件夹时优先打开当前目录;

v1.0.2.8

  • 1、修复:Edge合成频繁内存错误;

v1.0.2.7

  • 1、异常报错失去响应问题;

v1.0.2.6

  • 1、Edge接口整体调整优化,大幅提高合成稳定性;
  • 2、Edge接口增加跳过已完成片段功能;

v1.0.2.5

  • 1、修复:ApiKey区域获取token失败问题;

v1.0.2.4

  • 1、增加:ApiKey区域选择(注意:如果ApiKey区域选择错误,会一直显示获取token/获取token失败);
  • 2、任务结束不提示问题;

v1.0.2.3

  • 1、增加:对使用ApiKey模式合成音频进行校验,防止缺漏;
  • 2、部分逻辑优化;

v1.0.2.2

  • 1、修复:字幕配音批量执行bug;
  • 2、newMode启用开放测试时间段,详情见网页说明;

v1.0.2.1

  • 1、修复:newMode长文本合成428问题;

v1.0.2.0

  • 1、增加:设置页面增加新合成模式,尝试解决429问题;
  • 2、修改:AI语音识别导入方式,支持指定目录批量识别;
  • 3、删除:合成间隔相关设置(无意义);

v1.0.1.9

  • 1、修复:多角色顺序错乱问题;

v1.0.1.8

  • 1、修复:插入间隔不生效问题;

v1.0.1.7

  • 1、增加:多角色导出Srt字幕功能;
  • 2、修改:间隔休息在使用代理或APIKEY时不启用;

v1.0.1.6

  • 1、修复多角色合成乱序丢角色问题;
  • 2、修复角色列表单角色保存后无法载入问题;

v1.0.1.5

  • 1、增加接收音频数据校验,防止音频短缺;
  • 2、修复多角色合成顺序问题;

v1.0.1.4

  • 1、增加某象隧道代理动态转发接口;

v1.0.1.3

  • 1、增加某果隧道代理动态转发接口;
  • 2、修复使用微软APIkey无法设置风格问题;

v1.0.1.2

  • 1、增加MS免费接口发送请求自定义间隔;

v1.0.1.1

  • 1、修复使用apikey时多角色状态内容重复问题;

v1.0.1.0

  • 1、增加Whisper AI语音识别功能;
  • 2、修复使用微软APIKey Token时效性问题;

v1.0.0.9

  • 1、增加多角色数据保存功能;
  • 2、增加运行日志导出/清空菜单功能(鼠标右键);
  • 3、中小文本编辑区增加清空菜单;
  • 4、所有右键菜单增加图标;

v1.0.0.8

  • 1、增加微软Azure官方API接口(需自行注册申请AzureTTS服务apikey,地区选择:东亚);
  • 2、部分逻辑优化;

v1.0.0.7

  • 1、ms接口增加插入间隔功能(中小文本编辑区--鼠标右键--插入间隔);
    • 注意:插入间隔只支持MS接口文本合成,不支持导出SRT字幕模式下进行自定义间隔,导出字幕时文本内容进行自定义间隔会导致合成失败;
  • 2、部分代码逻辑优化;

v1.0.0.6

  • 1、修复多角色配音bug

v1.0.0.5

  • 1、对导出srt模式下TTS音频衔接进行细微调整;
  • 2、增加过滤几组已知特殊字符串。

v1.0.0.4

  • 1、修复部分特殊字符造成无法导出SRT问题;
  • 2、修复部分场景下无法删除音频片段问题;

v1.0.0.3

  • 1、修复文本合成导出srt吃字头问题;
  • 2、增拼音查询功能;

v1.0.0.2

  • 1、修复原始文件名命名带路径问题;
  • 2、增加SRT(MS/Edge)字幕配音功能;
  • 3、部分功能优化调整;

v1.0.0.1

  • 1、增加多音字替换功能;
  • 2、增加超长文本合成音频使用原始文件名命名功能;
  • 3、增加TXT文本拖拽导入功能;
  • 4、处理回车换行内容连续问题:
    • 注意:不建议使用回车换行取代标点符号,因为工具所有的文本分隔都是基于标点符号进行的,大量使用回车换行取代标点符号有可能导致合成出错!
  • 5、文本合成、导出SRT部分流程梳理、优化;

v1.0.0.0

  • 1、实现MS/Edge接口中小/超大文本合成;
  • 2、实现MS接口文本合成导出SRT字幕;
本站所有资源版权均属于原作者所有,这里所提供资源均只能用于参考学习使用,请在下载后24小时内删除,严禁商用。若由于商用引起版权纠纷,一切责任均由使用者承担。 【注意:本站发布资源来源于网络搜集,均有较强时效性,请在下载前注意查看文章资源发布或更新时间,距离当前时间太久的资源不建议下载,特别是安卓专区相关资源,会有大概率失效无法使用】