DownOL 软件仓库– 软件下载,字节世界与新知

DownOL 软件仓库– 软件下载,字节世界与新知

请输入关键字词

热门搜索排行

最新搜索排行

导航：首页 > 新闻 >

Web Speech to Text 可自动辨识影词组音并转存 SRT 字幕的免费工具，支援繁体中文

发表于：2026-06-24 作者：创始人

编辑最后更新 2026年06月24日，一直以来阿达都有在拍影片，上字幕可说是后制最麻烦的一件事，不难，但非常花时间，要一直反复听然后确认位置，相信有在剪影片的人都有这感受。先前我曾介绍过一个可自动把影词组音转成 SRT 字幕的中国服务，虽

一直以来阿达都有在拍影片，上字幕可说是后制最麻烦的一件事，不难，但非常花时间，要一直反复听然后确认位置，相信有在剪影片的人都有这感受。先前我曾介绍过一个可自动把影词组音转成 SRT 字幕的中国服务，虽然已经很不错用了，但还是有不少限制，像是最大档只能 2GB、档案必须上传、需手动转繁体等等。而这次要推荐的 Web Speech to Text 更加好用，档案不用上传，直接在浏览器完成语音辨识转 SRT 字幕的工作，也支援读取线上影片网址，更重要是，它支援繁体中文字幕，光这点就能省下很多时间，完全免费，下面也快速介绍给大家。

Web Speech to Text 使用介绍

Web Speech to Text 的使用方式非常简单，点我进入该网页后，会要求取得麦克风的权限，记得选择 "允许"。这也代表说，它的工作流程是影片声音从喇叭发出后，透过麦克风接收，然后再进行辨识，因此喇叭一定要开声音，且不能太小声，要不然会接收不到。

不过，Windows 系统还有另一个更好的选择，就是上方写的 "安装并启用 Virtual Audio Cable"，这套可以让电脑声音直接输出到麦克风，这样不仅不用担心喇叭太大声吵到别人，也能大幅提升声音的辨识品质。Mac 部分这套似乎没有支援，可以试试其他套：

如果你过去都没装过 Virtual Audio Cable，安装过程就一直按下一步即可：

而未来要辨识语音时，把右下方声音输出改成 Virtual Audio Cable，待辨识完再改回电脑喇叭：

读取影片有两种方式，第一是 "选择本机档案"（无需上传，直接在浏览器完成，因此多大的档案都行），第二则是 "读取网址"：

支援大家最常用的 YouTube：

辨识语言目前支援三个，繁体中文、普通话与英文：

选择好影片后，就可以按下开始辨识。过程中会即时把声音转换成文字，并记录开始、结束的时间。唯一要注意的是无法中断，必须全部跑完才会产生 SRT 字幕档，关掉网页所有内容都会消失，另外也建议使用尚未加入背景音乐的影片，辨识会更加准确：

完成之后就能把 SRT 字幕档下载下来：

不过，这套的语音辨识也还有很大进步空间，常常会出现漏掉或是辨识错误的状况，因此全部跑完一样需要一句句对，但至少时间都标记好，又是繁体中文，可省下不少时间。

补充资料

Web Speech to Text 网址：https://pulipulichen.github.io/HTML5-Speech-to-Text/

2022-05-09 13:05:03

影片字幕声音时间繁体喇叭档案选择中文网址语音麦克风麦克不用方式浏览器电脑网页过程工作云南精品咖啡产地咖啡网挂耳咖啡的正确冲泡方法咖啡豆种类防弹咖啡摩卡壶煮咖啡优缺点咖啡豆排行榜前十名中国咖啡网澳瑞白澳白咖啡咖啡耶加雪菲手磨咖啡云南咖啡咖啡豆瑰夏咖啡精品咖啡豆手冲咖啡和咖啡机区别咖啡网花魁咖啡咖啡耶加雪菲手磨咖啡云南咖啡咖啡豆瑰夏咖啡精品咖啡豆手冲咖啡和咖啡机区别咖啡网花魁咖啡

相关文章