离线运行的本地音视频转字幕工具一键音视频提取文字 STT

27*** · 发表于 2026-4-20 13:24:47

软件特点
离线运行的本地音视频转字幕工具，纯本地运行
支持cpu运行和GPU加速
完全免费，无需部署，一键运行
字幕支持输出json、srt字幕、纯文字txt格式

使用教程
下载后解压到某处，比如 E:/stt
双击 start.exe ，等待自动打开浏览器窗口即可
点击页面中的上传区域，在弹窗中找到想识别的音频或视频文件，或直接拖拽音频视频文件到上传区域，然后选择发生语言、文本输出格式、所用模型，点击“立即开始识别”，稍等片刻，底部文本框中会以所选格式显示识别结果
如果机器拥有英伟达GPU，并正确配置了CUDA环境，将自动使用CUDA加速注意：默认使用 cpu 运算，如果确定使用英伟达显卡，并且配置好了cuda环境，请修改 set.ini 中 `devtype=cpu`为`devtype=cuda`,并重新启动，可使用cuda加速

注意事项
如果没有英伟达显卡或未配置好CUDA环境，不要使用 large/large-v3 模型，可能导致内存耗尽死机
中文在某些情况下会输出繁体字
有时会遇到“cublasxx.dll不存在”的错误，此时需要下载 cuBLAS，然后将dll文件复制到系统目录下，点击下载 cuBLAS，解压后将里面的dll文件复制到 C:/Windows/System32下
如果控制台出现”[W:onnxruntime:Default, onnxruntime_pybind_state.cc:1983 onnxruntime::python::CreateInferencePybindStateModule] Init provider bridge failed.”, 可忽略，不影响使用
默认使用 cpu 运算，如果确定使用英伟达显卡，并且配置好了cuda环境，请修改 set.ini 中 devtype=cpu为 devtype=cuda,并重新启动，可使用cuda加速
尚未执行完毕就闪退
如果启用了cuda并且电脑已安装好了cuda环境，但没有手动安装配置过cudnn，那么会出现该问题，去安装和cuda匹配的cudnn。比如你安装了cuda12.3，那么就需要下载cudnn for cuda12.x压缩包，然后解压后里面的3个文件夹复制到cuda安装目录下。具体教程参考 https://juejin.cn/post/7318704408727519270
如果cudnn按照教程安装好了仍闪退，那么极大概率是GPU显存不足，可以改为使用 medium模型，显存不足8G时，尽量避免使用largev-3模型，尤其是视频大于20M时，否则可能显存不足而崩溃

游客，如果您要查看本帖隐藏内容请回复

guib*** · 发表于 2026-4-21 01:07:41

此帖仅作者可见

18931*** · 发表于 2026-4-21 08:33:05

此帖仅作者可见

账号		自动登录	找回密码
密码			立即注册

guib* guib* 当前离线积分 2785 发消息	发表于 2026-4-21 01:07:41 \| 显示全部楼层此帖仅作者可见
guib* guib* 当前离线积分 2785 发消息
	使用道具举报

18931* 18931* 当前离线积分 630 发消息	发表于 2026-4-21 08:33:05 \| 显示全部楼层此帖仅作者可见
18931* 18931* 当前离线积分 630 发消息
	使用道具举报

[网络合集] 离线运行的本地音视频转字幕工具一键音视频提取文字 STT

浏览过的版块

[网络合集] 离线运行的本地音视频转字幕工具 一键音视频提取文字 STT

浏览过的版块

[网络合集] 离线运行的本地音视频转字幕工具一键音视频提取文字 STT