DownOL 软件仓库– 软件下载,字节世界与新知

Web Speech to Text 可自动辨识影词组音并转存 SRT 字幕的免费工具,支援繁体中文

发表于:2024-04-29 作者:创始人
编辑最后更新 2024年04月29日,一直以来阿达都有在拍影片,上字幕可说是后制最麻烦的一件事,不难,但非常花时间,要一直反复听然后确认位置,相信有在剪影片的人都有这感受。先前我曾介绍过一个可自动把影词组音转成 SRT 字幕的中国服务,虽

一直以来阿达都有在拍影片,上字幕可说是后制最麻烦的一件事,不难,但非常花时间,要一直反复听然后确认位置,相信有在剪影片的人都有这感受。先前我曾介绍过一个可自动把影词组音转成 SRT 字幕的中国服务,虽然已经很不错用了,但还是有不少限制,像是最大档只能 2GB、档案必须上传、需手动转繁体等等。而这次要推荐的 Web Speech to Text 更加好用,档案不用上传,直接在浏览器完成语音辨识转 SRT 字幕的工作,也支援读取线上影片网址,更重要是,它支援繁体中文字幕,光这点就能省下很多时间,完全免费,下面也快速介绍给大家。

Web Speech to Text 使用介绍

Web Speech to Text 的使用方式非常简单,点我进入该网页后,会要求取得麦克风的权限,记得选择 "允许"。这也代表说,它的工作流程是影片声音从喇叭发出后,透过麦克风接收,然后再进行辨识,因此喇叭一定要开声音,且不能太小声,要不然会接收不到。

不过,Windows 系统还有另一个更好的选择,就是上方写的 "安装并启用 Virtual Audio Cable",这套可以让电脑声音直接输出到麦克风,这样不仅不用担心喇叭太大声吵到别人,也能大幅提升声音的辨识品质。Mac 部分这套似乎没有支援,可以试试其他套:

如果你过去都没装过 Virtual Audio Cable,安装过程就一直按下一步即可:

而未来要辨识语音时,把右下方声音输出改成 Virtual Audio Cable,待辨识完再改回电脑喇叭:

读取影片有两种方式,第一是 "选择本机档案"(无需上传,直接在浏览器完成,因此多大的档案都行),第二则是 "读取网址":

支援大家最常用的 YouTube:

辨识语言目前支援三个,繁体中文、普通话与英文:

选择好影片后,就可以按下开始辨识。过程中会即时把声音转换成文字,并记录开始、结束的时间。唯一要注意的是无法中断,必须全部跑完才会产生 SRT 字幕档,关掉网页所有内容都会消失,另外也建议使用尚未加入背景音乐的影片,辨识会更加准确:

完成之后就能把 SRT 字幕档下载下来:

不过,这套的语音辨识也还有很大进步空间,常常会出现漏掉或是辨识错误的状况,因此全部跑完一样需要一句句对,但至少时间都标记好,又是繁体中文,可省下不少时间。

补充资料

Web Speech to Text 网址:https://pulipulichen.github.io/HTML5-Speech-to-Text/

2022-05-09 13:05:03
0