关于微软Azure免费TTS接口说明:
一、2023.10.25下午开始,微软官方对TTS免费接口合成次数进行了限制,每日合成上限为20次,此限制是基于当前机器公网IP地址,问题表现一直合成失败429("code":"TooManyRequests","message":"The rate limit has been reached. The timeout in seconds can be found in the Retry-After header."),当合成次数达到上限后,此公网IP就需要等待24小时后才可以继续合成,应对策略:
- 1、使用微软接口VIP线路,普通用户5000字符/天,网站VIP用户50000字符/天,试听免费不计额度(使用VIP线路时日志窗口会有额度信息显示),
- 使用方法:选择“微软”接口,设置选项--勾选VIP线路1启用
- 有更高使用需求的朋友可选择为指定账号单独购买额度套餐!点击查看购买套餐及使用演示教程(注意:不是网站VIP用户无法购买,购买了也无法使用)
- 2、有条件也可自行申请使用官方的apikey,官方Apikey免费额度为每月50W字符(汉字约25W字符)(点击观看视频教程),注意:微软官方是以token计量
- 3、自行购买HTTPS/SOCKS5代理,可绕过此限制,前提:要求代理节点IP够多,够干净,否则用的人多了,很快就会被大范围限制;
- 4、临时应急可以通过使用全局代理切换公网IP,如果是家庭环境,则可以通过重新拔号上网达到切换公网IP的目的,如果可以连接手机热点,则可以通过手机端开启/关闭飞行模式达到切换公网IP的目的(注意:公网IP资源有限,并不是说你切换了一个新的公网IP就一定可以合成20次,可以合成20次的前提是,你拿到的这个公网IP在你之前24小时内,没有被别人用于微软TTS合成,如果这个公网IP被别人拿去合成过,那20次用一次就少一次,如果被别人把20次用完,你直接就会是429;
二、2023.12.8日傍晚开始,微软TTS免费接口对TTS合成音频音质进行了限制,目前仅支持24khz-16bit音质,后续ZTJ-TTS中使用微软TTS免费接口时,音质选项将不再生效,使用微软官方APIKEY不受此影响;
前情:
- 1、ZTJ-TTS软件账号密码即为本网站用户账号密码;
- 2、本网站VIP用户即为ZTJ-TTS工具VIP用户,本网站非VIP用户即为ZTJ-TTS普通用户;
当前版本:
v1.0.9.3
- 1、修复:隐藏bug,可能导致内容缺失;
- 注意:v1.0.9.1版本起,因角色数据更新,角色ID顺序会有所变化,如果有保存多角色数据,请清除角色数据后重新设置保存!!!
友情提示:
- ZTJ-TTS为全新版本TTS文本转语音工具,开发定位为网站VIP福利!本工具所有功能有文档,有视频,简单问题请自行查阅学习,BUG或意见建议请加群按照提交规则进行反馈,使用本工具不提供任何1对1解答服务!!!
- 问题反馈:点击软件左下角添加Q群提交,提交bug请按照群文件内bug提交规则进行,非此Q群内提交或未按照Q群内bug提交规则提交概不处理!!!
- 非VIP用户仅开放基本TTS合成功能,且合成内容有长度限制,无次数限制!
- 首次使用,请仔细阅读以下文档/视频,磨刀不误砍柴功!
主要功能:
文本转语音(微软Azure免费/收费接口/Edge接口/火山TTS接口/OpenAI TTS接口)、Srt字幕编辑、Srt字幕合成语音、AI语音识别导出srt、txt、vtt、lic
界面
视频教程
- ZTJ-TTS使用视频教程:
- 微软接口VIP线路详细说明&使用教程
- 注册微软Azure申请APIKEY,视频教程
- 火山TTS注册申请创建【语音合成】应用获取APPID/AccessToken视频教程:https://www.bilibili.com/video/BV11j411j7C8/
OpenAi TTS免费无限注册获取OpenAI Apikeys视频教程:https://ztjun.fun/2199.html(OpenAI新注册账号已经没有5$赠送金额了,只能自己买apikeys)- 为了奖励认真阅读文档的你,微信公众号(网站页面最底部二维码)后台回复tts可免费获取软件下载地址!接下来的是详细的文字教程,强烈建议认真看一遍,工具是解决问题,而不是制造问题的,当然前提是你要对工具有基本的了解,花点时间学习一下,最终方便还是自己,谨记:麿刀不误砍柴功。
文字教程
-
微软Azure:支持文本配音、导出Srt字幕、Srt字幕配音,同时支持使用官方API(需要自行申请注册 Azure TTS 服务 apikey)
-
Edge朗读:支持文本配音、Srt字幕配音
-
火山TTS:支持文本配音、导出Srt字幕、Srt字幕配音(需要自行申请注册申请Apikey)
- OpenAI TTS:支持文本配音(需要Apikey)
2、角色
-
当前角色(旁白角色)
合成文本不进行角色设置时,将直接使用此处角色进行TTS语音合成,如果合成文本中存在角色设置,则对文本中所有没有指定角色的文本使用此处角色进行配音,和旁白的类似
-
角色列表
文本配音时有多角色需求时,可以先在当前角色区域将所需要的角色参数调整设置好,然后点击[添加]按钮,即可将此角色加入角色列表,加入角色列表后,才可以在右侧文本编辑区域进行角色设置,角色列表最多支持50个角色。
- 保存角色数据
-
- 在多角色列表区域点击鼠标右键,弹出菜单--保存 即可,需要使用时,同样在多角色列表区域点击鼠标右键,弹出菜单--载入 即可
3、文本配音
3.1、中小文本
-
角色试听
以左侧当前角色设置参数试听当前文本内容,支持选择指定文本试听;
-
设置角色
使用此功能需要在左侧列表先添加角色,然后使用指定角色对选中范围文本内容进行标记,进行过角色标记的内容在后面进行语音合成时,将以指定的角色设置进行语音合成。
使用方法:在中小文本编辑区域,选择要指定角色的文本内容,鼠标右键--设置角色--选择左侧角色列表中添加好的指定角色即可。
注意:不支持角色嵌套,如果存在角色嵌套会导致无法合成(角色嵌套是指在已指定角色的文本中再次指定其它角色)
角色嵌套示例:{R云健(男性)(1)|xxx{R晓辰(女性)(0)|xxxxxxxxxxxxxxxR}xxxR}
-
插入间隔
在当前光标位置插入指定时长间隔,单位为毫秒(ms),1000ms=1秒(注意:Edge接口不支持插入间隔功能)
3.2、超大文本
-
支持文件格式:编码格式为utf8的txt文档,非utf8编码将显示编码错误
-
导入方法
-
拖放:选择需要导入的txt文件,直接拖到软件界面导入
-
超大文本表格区域鼠标右键--导入,选择文件完成导入
-
-
不限制文件大小
-
小提示:通常情况下,20000字符中文内容,合成音频后的时长约为2小时(120分钟)左右,以此类推,10000字符中文内容长度合成音频时长约为1小时左右,1600字符中文内容合成音频时长约为10分钟。
-
3.3、全局间隔
全局间隔,主要用于一键设置全文所有语句间隔停顿时间,勾选启用。
3.4、导出Srt字幕
文本配音时是否同步导出Srt字幕,勾选启用。
导出模式:
m1模式:纯算法本地实现,有概率生成失败(为确保成功率和准确率,使用此功能时单次字符数量不得超过25000)注意:普通文本配音与导出Srt字幕m1模式的文本配音是两种截然不同的模式,合成效果也会有所不同,另外导出Srt字幕模式的文本配音不支持自定义插入间隔,两者有冲突,有可能造成合成失败。另外,m1模式导出Srt字幕时根据角色语速不同,需要对全局间隔参数进行微调,具体的全局间隔数值需要自己进行耐心调校测试,否则生成效果可能会不尽人意。
m2模式:服务器远程AI识别生成字幕,优点:成功率高,支持最长不超过3小时音频生成字幕,缺点:由于是AI识别生成,可能有少量字幕内容音对字不对。
3.5、多音字
-
直接使用拼音替代
使用查拼音功能查完后,将文本中需要指定音调的多音字使用查询到的指定音调的拼音替换
-
编辑替换多音字列表
设置选项--编辑替换多音字列表--弹出窗口,输入原始多音字英文逗号替换的同音字,一行一个,如上图所示,编辑完成后,点击确定即可
注意:此处将直接对合成文本中的多音字进行全局替换,所以使用多音字替换后,导出Srt时,需要对导出的Srt中的多音字文本进行手动还原。
4、字幕配音
4.1、字幕编辑
字幕编辑表格区域点击鼠标右键--导入,导入需要编辑的Srt字幕文件,导入完成后就可以开始修改,修改完成后,点击鼠标右键--保存,即可将修改后的srt进行保存
4.2、字幕配音
-
导入:导入字幕,或者直接将Srt字幕文件拖动到软件界面完成导入
-
清空:清空列表
注意:!!!
根据Srt字幕内容进行配音,需要注意,此模式对Srt字幕文件合理性要求较高,所谓字幕文件合理性,是指逐条字幕内容与其所对应的时间轴是否匹配,简单举例:
5 00:00:12,381 --> 00:00:14,109 这就是为什么我们将选项放在一起的原因让您了解我们的指南以上是字幕文件中的一组字幕数据,含义如下:
序号
字幕开始时间:00:00:12,381 --> 字幕结束时间:00:00:14,109
字幕内容:这就是为什么我们将选项放在一起的原因让您了解我们的指南
空行结束
以上是一条标准的SRT字幕格式,包含序号、字幕开始/结束时间、字幕文本内容、空行结束,缺一不可!
通过简单计算可获取此条字幕内容显示的时间=结束时间(14.109)-开始时间(12.381)=1.728(秒)
这就是非常典型不合理的字幕文件,因为正常情况下,这么长的一段字幕内容,完整表述所需的时间绝对不止1.728秒,
如果你的字幕文件存在类似于这种不合理的时间轴,软件为了准确对齐时间轴,就只能对这段内容的音频进行加速处理,以缩短这条字幕音频的时长,让其小于1.728秒,如果不对这段字幕对应的音频进行加速处理,那么这条音频就无法在时间轴指定的时间内播放完成,它就会直接影响下一条字幕,造成尾压头声音重叠的问题。
总结:如果你在进行Srt字幕配音时,发现最终音频中时不时有语句突然加速的现象,那么,请参照上述内容,自行手动调整加速语句对应Srt字幕文件时间轴,以确保其合理性。
小提示:这种问题通常都是对字幕文件进行翻译以后出现,原因就是原始字幕文件的时间轴使用原始语言是合理的,经过翻译后同样一句话,内容长度会发生变化,而此时时间轴没变,这才是根源。
5、语音识别
注意:模型下载完成后需要移动到软件目录下的whisper文件夹中。
- 1、选择音视频目录:选择需要进行语音识别的音视频文件保存目录,软件将对指定目录下所有*.mp4/*.mp3/*.wav文件进行批量AI语音识别;
- 2、选择语音:选择音视频文件的语言类型,zh:中文,en:英文,找不到或是不知道就保持默认:auto即可。
- 3、选择模型:模型越大,需要内存越大,识别结果越准确,识别时间也会越长,点此下载模型文件:
-
所有模型共分五个档次,从小到大分别为:tiny、base、small、medium、large
-
模型越大,需要内存越多,识别结果相对越准确,语音识别需要的时间也会越长,
-
模型命名:每1档模型又分为4个型号,以base模型为例:
-
base.bin:基础模型,适合处理多种语言的语音识别任务。这个模型体积适中,性能较为平衡,适合在多语言场景下使用。
-
base-q5_1.bin:base 模型的量化版本,q5_1 表示使用了一种特定的量化方案,在保持较好准确率的同时显著减少了模型的体积,适合在资源有限的设备上运行。
-
base.en.bin:基于 base 模型专门为英文语音识别优化的版本。相比于多语言版本,它可能在处理英文语音时性能更好,识别准确率更高。
-
base.en-q5-1.bin:base.en 模型的量化版本,q5_1 表示使用了一种特定的量化方案,在保持较好准确率的同时显著减少了模型的体积,适合在资源有限的设备上运行。
-
- 请结合自身需求选择下载合适的模型。
-
- 4、输出文件:识别出的文本内容保存格式,当前支持输出 txt/srt/vtt/lrc 格式,识别成功后,输出文本文件保存在音视频文件相同目录且名称相同。
- 5、启用GPU加速(需要有显卡,其次需要安装显卡对应版本的CUDA,这块坑比较多,大家自行查阅相关资料)
设置选项
-
微软TTS线路测试:免费线路延迟测试(通常情况下,晚上是使用高峰期,此时免费接口服务器响应会变慢,甚至无响应,导致合成失败)
-
保存目录:TTS合成音频保存目录
-
打开:打开保存目录
-
选择文件夹:选择音频保存目录
-
-
超大文本合成音频使用原始文件名命名:在超长文本模式下生效,勾选后,最终合并音频文件名以“原始导入文本文件名_All”进行命名
-
合成结束打开保存目录:在语音合成任务完成后打开保存目录(如果保存文件夹已经有打开则不会再打开)
-
合成结束是否播放提示音:勾选播放,不勾选不播放
-
分段音频合并数量:在进行超长文本合并时,如果将所有音频进行完整合并,最终生成的音频文件将会非常大,动辙几GB,于是采取了二级合并的模式,可以自行根据需求按指定数量合并(如果还是不能理解,打个比方,你的文本合成音频后,有300个音频文件,如果对这300个音频文件进行完整合并,最终合成的文件只有一个,且文件大小将会达到几GB,不方便移动传输,且合成时’E9会非常长,现增加的二级合并,意思就是按照指定的数量对前面生成的300个文件进行合并,比如默认二级合并数量50,意思就是以50个音频为一组,对前面的300个音频进行分开合并,这样300个音频文件合成完成后,就会生成6个二级合并的音频文件,每个二级合并音频文件大小就会降到几百MB)
-
是否进行最终完整合并:就是将所有分段音频文件合并成一个音频文件。
- 合成结束添加背景音乐:TTS语音合成完成后,自动添加指定/随机随机音乐,
- 添加指定背景音乐,点击按钮弹出音频文件选择窗口,选择相应的背景音乐即可;
- 添加随机背景音乐,在第一次弹出的音频选择窗口点击“取消”,然后软件会自动进入文件夹浏览选择窗口,选择背景音乐所在文件夹后确定即可。
- 循环:勾选后,当TTS语音时间很长,而背景音乐时长较短时,会重复循环播放背景音乐,直到TTS音频结束,不勾选时,背景音乐播放一次就会结束播放;
- 自定义代理:
解决微软免费接口访问速率限制(429问题),使用方法:设置代理的IP地址和端口后,选择相应的代理类型,最后勾选上面的启用即可。
- 微软接口VIP线路:后端采用APIKey形式,全面解决微软免费接口访问速率限制(429问题)
- VIP用户每天50000字符!有更高使用需求的朋友可为指定账号单独购买更高额度套餐。详情:https://ztjun.fun/2323.html
-
微软APIkey:使用微软Azure接口时,勾选生效,需要自行申请注册微软Azure TTS服务apikey,点击观看视频教程,区域选择一定不能错,错了无法获取token,提示:最好不要在某宝等平台购买此apikey,群里已经有N例了,用着用着莫明其妙就失效,无法获取token,如果你是从某宝购买的apikey,在选择了对应区域后还是一直获取token失败,那恭喜你,中招了!
- 火山TTS:需要自行注册并开通【语音合成】服务,点击观看视频教程,注册开通后,如下图所示获取并填写AppID/Token:
常见问题 & 注意事项
1、路径问题
上图可以看到,当前程序路径即为软件所在目录的完整路径,在此完整路径中,不能有空格或是英文小括号等特殊字符,它们会导致TTS语音合成后无法进行最终合并;
解决办法:将ztj-tts文件夹剪切到其它盘符的根目录下,确保ztj-tts所在文件夹名称中不包括空格或英文小括号等特殊字符即可。
2、权限问题
问题表现:文件无法拖放/音频合成完成后无法合并/勾选删除分段音频无法删除等等;
解决方法:可以尝试把各类电脑管家/杀毒软件关闭,再使用管理员权限运行(不要使用快捷方式),如果有弹出对话框询问是否允许之类的提示,记得一定要允许!!!
3、误杀问题
问题表现:ZTJ-TTS压缩包下载后一解压就被删了,或者用着用着就没了;
解决办法:关闭win10以上系统文件实时保护功能(Windows安全中心--病毒和威胁防护--“病毒和威胁防护”设置--管理设置--实时保护--关闭)、关闭杀毒软件(原因是软件有加密保护,会造成杀毒软件误杀);
4、合成失败问题
- 1、超长文本需要要注意文本所在路径以及txt文本文件名称,两者都尽量不要包含特殊字符如英文括号/空格等,它们可能导致合成失败;
- 2、中小文件合成时,需要检查文本内容是否包含特殊字符,特别需要警惕那些看起来像空格的不可见字符,因为很多特殊符号肉眼看起来非常像是空格,但实际上它是特殊符号,推荐使用notepad等文本编辑工具进行查看编辑删除;
- 小技巧:如何快速分辨是文件名/路径导致的合成失败还是文本内容有问题导致的合成失败:如果是文件名或路径问题,那么日志窗口在显示提交合成文本后就没有后续了,如果是文本内容有问题,那么日志窗口提交文本后会有相应错误提示的,通过这一点就可以快速分辨是路径、文件名问题还是文本内容问题;
解决办法:
-
-1/-3:网络不稳定,连接超时;
-
-2:网络问题缺失数据,校验未通过;
-
200:请求成功;
-
400[ms/edge]:合成文本内存在特殊字符,请检查去除后再试;
-
429[ms]:当前IP已达到合成上限;
-
3010[hs]:文本长度超限;
-
更新日志
V1.0.9.3
- 1、修复:隐藏bug,可能导致内容缺失;
V1.0.9.2
- 1、更新:Edge接口解决Sec-MS-GEC参数,恢复正常使用;
V1.0.9.1
- 1、更新:微软接口角色同步官方最新角色数据;
- 2、优化:UI界面部分细节调整,角色列表数据更清晰;
- 注意:因角色数据更新,角色ID顺序会有所变化,如果有保存多角色数据,请清除角色数据后重新设置保存!!!
V1.0.9
- 1、移除EdgeTTS接口:EdgeTTS官方对国区EdgeTTS接口增加了限制,所有使用EdgeTTS接口的第三方工具已全部失效!
- 2、更新:日志显示及保存格式;
v1.0.8.9
- 1、增加:登录完成后日志窗口增加用户组【普通用户/网站VIP】显示;
- 2、升级:文本合成导出字幕m2模式升级为服务端AI识别生成,识别字幕音频最长不超过3小时;
v1.0.8.8
- 1、修复:部分特殊场景合成失败问题及几处隐藏bug;
- 2、增加:自助开通微软接口VIP线路;
v1.0.8.7
- 1、更新:AI语音识别功能升级(支持x86系统、支持GPU加速(需要安装CUDA)、增加模型);
- 2、增加:换行间隔支持Linux系统文本换行(LF)模式;
- 注意:此版本支持库文件有更新,请下载使用完整版本。
v1.0.8.4
- 1、修复:一台机器同时运行多个实例相互影响问题;
- 2、修复:微软接口VIP线路试听错误问题;
- 3、增加:运行日志文件自动保存到log目录下,方便上传反馈 ;
v1.0.8.1
- 1、修复:微软接口TTS合成结尾丢字问题;
v1.0.8.0
- 1、增加:微软接口VIP线路增加2台服务器线路,加快合成速度;
v1.0.7.9
- 1、增加:微软接口同步更新增加4个新角色(云逸、云杰、晓宇、云奇);
- 2、修复:指定文件、目录字符清理点击按钮无效问题;
- 3、优化:部分逻辑优化;
v1.0.7.7
- 1、升级:微软TTS合成升级为多线程,当前阶段为保证稳定使用,暂开2个线程;
- 2、修复:微软TTS合成导出Srt时文本内容超过一定长度导出失败问题;
- 3、优化:SRT字幕配音功能将对字幕文件可能存在的空字幕情况自动进行处理;
v1.0.7.6
- 1、优化:Edge接口TTS合成报内存错误问题;
- 2、增加:开放普通用户微软接口VIP线路使用权限,可进行少量文本试听、合成;
- 3、删除:移除微软接口VIP线路2(代理IP);
v1.0.7.5
- 1、修复:微软接口VIP线路一批量合成时的字符计数BUG;
v1.0.7.1
- 1、修改:微软接口VIP线路1改造,普通VIP用户合成30000字符/天,合成不成功不计数;
- 注意:后续将取消VIP线路代理IP形式,全部改为字符额度,已购买代理IP用户可继续使用至套餐结束;
v1.0.7.0
- 1、优化:微软、edge接口文本配音导出字幕、字幕配音功能;
- 2、修复:几个小bug;
v1.0.6.9
- 1、增加:批量文本处理功能;
- 2、优化:微软TTS新角色SRT配音;
- 3、修复:Edge接口遇到网络问题导致提前合并bug;
- 4、修复:AI语音识别无反应bug;
v1.0.6.8
- bug修复;
v1.0.6.7
- bug修复;
v1.0.6.6
- 1、增加:中小文本特殊字符清理功能(中小文本框内鼠标右键-文本清理);
- 2、优化:微软、Edge、火山文本合成导出SRT功能,提高成功率;
- 3、增加:合成音频增加指定片头音乐功能;
v1.0.6.5
- 1、增加:文本转语音最终合并阶段增加音频文件fileSize显示;
v1.0.6.4
- 1、修复:微软接口SRT字幕配音自动调节功能;
v1.0.6.3
- 1、优化:微软接口SRT字幕配音功能;
- 2、增加:微软接口小辰新风格(实时广告);
- 3、优化:后端登录验证系统逻辑;
v1.0.6.2
- 1、增加:OpenaiAPI自定义代理设置;
- 2、优化:微软新角色导出srt功能;
v1.0.6.0
- 1、修复:新增共享代理线路BUG。
v1.0.5.9
- 1、优化:使用VIP共享代理不成功不计数。
v1.0.5.8
- 1、增加:VIP共享代理线路2;
- 2、优化:VIP共享代理线路合成逻辑,提高代理合成成功率。
v1.0.5.7
- 1、优化:音频合并逻辑;
- 2、共享线路代理IP模块更新;
v1.0.5.6
- 修复:srt字幕合成音频问题
v1.0.5.5
- 1、微软接口添加9个新角色:中文:晓晓-New,英语:Ava、Andrew、Emma、Brian,德语:Florian、Seraphina,法语:Remy、Vivienne
v1.0.5.4
- 1、优化:TTS最终合成音频质量与设定音频质量保持一致!
- 2、修复:分段音频合并数量设置无效bug;
v1.0.5.3
- 1、修复:火山TTS接口选择高音质选项无法最终合并bug!
v1.0.5.2
- 1、增加:Edge接口导出Srt增加m2新模式,导出字幕更稳定,缺点速度较m1模式慢;
- 2、优化:Edge接口合成错误重试机制;
v1.0.5.1
- 1、修复无多处登录频繁跳出问题;
v1.0.5.0
- 1、网站因安全问题进行更新升级,此次更新为软件登录模块的同步更新!届时,所有版本号低于v1.0.5.0版本将因网站更新升级,登录接口失效从而无法登录使用!
v1.0.4.9
- 1、修复:bug修复;
v1.0.4.8
- 1、增加:重新设计增加换行间隔功能;
- 2、其它细节调整优化;
v1.0.4.7
- 1、修改:移除换行间隔,此功能与其它功能存在冲突;
- 2、修复:多角色配音文本分隔算法重写,解决多角色配音乱序问题;
- 3、界面微调:日志窗口可在设置界面单独开启关闭;
- 4、其它细节调整优化;
v1.0.4.6
- 1、增加:微软免费接口VIP共享代理增加额度提示;
- 2、增加:可单独购买代理IP,详情见网站文档说明;
v1.0.4.5
- 1、增加:微软免费接口增加VIP共享代理;
- 2、修改:移除某果代理,修改为更灵活的自定义HTTPS或socks5代理;
v1.0.4.4
- 修复:部分场景多角色无法合成bug;
v1.0.4.3
- 修复:部分场景导出字幕文件产生多余空行问题;
v1.0.4.2
- 修复:部分场景下中小文本合成成功无音频文件bug;
v1.0.4.1
- 修复:edge接口合成提前完成问题;
v1.0.4.0
- 1、增加:ms、火山tts增加全局换行符指定间隔;
- 2、修复:edge接口试听完成后按钮无法恢复问题;
- 3、调整:为避免可能出现的问题将火山tts接口调整到最后;
- 4、其它部分细节调整;
v1.0.3.9
- 1、修复:微软接口导出SRT或设置全局间隔时合成音频偶尔出现不正常断句问题;
- 2、修复:合成音频添加背景音乐后音频质量下降问题;
- 3、优化:Edge接口文本转语音功能优化,增加合成速度,解决部分卡顿问题;
- 4、文本转语音导出SRT功能单次字符数量不得超过20000(暂定);
v1.0.3.8
- 1、修复:微软免费接口Srt字幕配音Err400问题;
- 2、增加:合成音频添加指定/随机背景音乐功能;
v1.0.3.7
- 1、解决微软免费接口音质限制导致无法合成问题(后续使用微软免费接口时选择音质不再生效,使用官方APIKEY不受影响);
v1.0.3.6
- 1、增加:Edge接口文本合成增加导出Srt字幕功能;
v1.0.3.5
- 1、增加:OpenAi文本转语音接口(需OpenAI的ApiKey及相应的魔法环境);
- 2、修复:更换获取公网IP接口,解决使用某果代理无法查询添加白名单问题;
- 3、其它:部分细节调整优化;
v1.0.3.4
- 1、修复:英文角色活力女生数据错误;
- 2、修改:火山角色数据改为动态获取,方便后续增删修改;
- 3、火山接口增加角色擎苍v2;
v1.0.3.3
- 1、修复:合成结束无音频问题;
- 2、修复:保存配置错误问题;
v1.0.3.2
- 1、调整:取消MS接口429错误超过5次停止;
- 2、增加:MS接口APIkey区域保存;
- 3、增加:火山TTS接口(支持文本/Srt转语音、导出SRT)
- 4、优化部分功能执行逻辑;
v1.0.3.1
- 1、调整:取消连接4秒超时设定;
- 2、修改:从此版本起取消强制更新(注意:v1.0.3.1以前老版本不可用,1.0.3.1及后续版本可选择不更新,且可使用)
v1.0.3.0
- 1、修复:微软接口无法导出字幕问题;
v1.0.2.9
- 1、修复:Edge接口试听问题;
- 2、修改:设置界面选择保存文件夹时优先打开当前目录;
v1.0.2.8
- 1、修复:Edge合成频繁内存错误;
v1.0.2.7
- 1、异常报错失去响应问题;
v1.0.2.6
- 1、Edge接口整体调整优化,大幅提高合成稳定性;
- 2、Edge接口增加跳过已完成片段功能;
v1.0.2.5
- 1、修复:ApiKey区域获取token失败问题;
v1.0.2.4
- 1、增加:ApiKey区域选择(注意:如果ApiKey区域选择错误,会一直显示获取token/获取token失败);
- 2、任务结束不提示问题;
v1.0.2.3
- 1、增加:对使用ApiKey模式合成音频进行校验,防止缺漏;
- 2、部分逻辑优化;
v1.0.2.2
- 1、修复:字幕配音批量执行bug;
- 2、newMode启用开放测试时间段,详情见网页说明;
v1.0.2.1
- 1、修复:newMode长文本合成428问题;
v1.0.2.0
- 1、增加:设置页面增加新合成模式,尝试解决429问题;
- 2、修改:AI语音识别导入方式,支持指定目录批量识别;
- 3、删除:合成间隔相关设置(无意义);
v1.0.1.9
- 1、修复:多角色顺序错乱问题;
v1.0.1.8
- 1、修复:插入间隔不生效问题;
v1.0.1.7
- 1、增加:多角色导出Srt字幕功能;
- 2、修改:间隔休息在使用代理或APIKEY时不启用;
v1.0.1.6
- 1、修复多角色合成乱序丢角色问题;
- 2、修复角色列表单角色保存后无法载入问题;
v1.0.1.5
- 1、增加接收音频数据校验,防止音频短缺;
- 2、修复多角色合成顺序问题;
v1.0.1.4
- 1、增加某象隧道代理动态转发接口;
v1.0.1.3
- 1、增加某果隧道代理动态转发接口;
- 2、修复使用微软APIkey无法设置风格问题;
v1.0.1.2
- 1、增加MS免费接口发送请求自定义间隔;
v1.0.1.1
- 1、修复使用apikey时多角色状态内容重复问题;
v1.0.1.0
- 1、增加Whisper AI语音识别功能;
- 2、修复使用微软APIKey Token时效性问题;
v1.0.0.9
- 1、增加多角色数据保存功能;
- 2、增加运行日志导出/清空菜单功能(鼠标右键);
- 3、中小文本编辑区增加清空菜单;
- 4、所有右键菜单增加图标;
v1.0.0.8
- 1、增加微软Azure官方API接口(需自行注册申请AzureTTS服务apikey,地区选择:东亚);
- 2、部分逻辑优化;
v1.0.0.7
- 1、ms接口增加插入间隔功能(中小文本编辑区--鼠标右键--插入间隔);
- 注意:插入间隔只支持MS接口文本合成,不支持导出SRT字幕模式下进行自定义间隔,导出字幕时文本内容进行自定义间隔会导致合成失败;
- 2、部分代码逻辑优化;
v1.0.0.6
- 1、修复多角色配音bug
v1.0.0.5
- 1、对导出srt模式下TTS音频衔接进行细微调整;
- 2、增加过滤几组已知特殊字符串。
v1.0.0.4
- 1、修复部分特殊字符造成无法导出SRT问题;
- 2、修复部分场景下无法删除音频片段问题;
v1.0.0.3
- 1、修复文本合成导出srt吃字头问题;
- 2、增拼音查询功能;
v1.0.0.2
- 1、修复原始文件名命名带路径问题;
- 2、增加SRT(MS/Edge)字幕配音功能;
- 3、部分功能优化调整;
v1.0.0.1
- 1、增加多音字替换功能;
- 2、增加超长文本合成音频使用原始文件名命名功能;
- 3、增加TXT文本拖拽导入功能;
- 4、处理回车换行内容连续问题:
- 注意:不建议使用回车换行取代标点符号,因为工具所有的文本分隔都是基于标点符号进行的,大量使用回车换行取代标点符号有可能导致合成出错!
- 5、文本合成、导出SRT部分流程梳理、优化;
v1.0.0.0
- 1、实现MS/Edge接口中小/超大文本合成;
- 2、实现MS接口文本合成导出SRT字幕;
评论(8)
密码是啥
前情:
1、ZTJ-TTS软件账号密码即为本网站用户账号密码;
2、本网站VIP用户即为ZTJ-TTS工具VIP用户,本网站非VIP用户即为ZTJ-TTS普通用户;
3、只有VIP用户才可以购买使用微软接口的VIP线路;
API咋没提供了?
有的,只是更换了新接口
这些话说了肯定被删,但是我作为付费用户我还是说,用不了了,而且以前还允许自己定代理,现在完全开始深度定制了。
这位朋友,设置界面:微软免费接口自定义代理(HTTPS/Socks5),看到了没有,哎~~~~~
设置选项界面能不能有个保存默认啊,用KEY每次都要调一次选区,有点麻烦呀~~~~
期待