VideoSrt简介
VideoSrt是一个可以识别视频语音自动生成字幕SRT文件的开源软件工具。基于Golang语言,使用lxn/walk Windows-GUI工具包开发的开源软件工具。适用于快速、批量的为媒体(视频/音频)生成中/英文字幕、文本文件的业务场景。
VideoSrt具有易用的界面和多种强大功能,使其成为处理媒体字幕的理想选择。
VideoSrt需要注册阿里云账号,接入语音引擎,用于语音识别生成字幕文件(和Autosub-ahk功能一样,只不过Autosub-ahk接入的是Google Speech V2 API),也需要注册百度翻译开放平台账号或者腾讯云账号,接入翻译引擎,用于将英文字幕文件翻译为中文字幕文件,具体教程看GitHub简介
VideoSrt应用场景:
-
识别视频/音频的语音生成字幕文件(支持中英互译,双语字幕)
-
提取视频/音频的语音文本
-
批量翻译、过滤处理/编码SRT字幕文件
VideoSrt优势:
-
使用阿里云语音识别接口,准确度高,标准普通话/英语识别率95%以上
-
视频识别无需上传原视频,方便快速且节省时间
-
支持多任务多文件批量处理
-
支持视频、音频常见多种格式文件
-
支持同时输出字幕SRT文件、LRC文件、普通文本3种类型
-
支持语气词过滤、自定义文本过滤、正则过滤等,使软件生成的字幕更加精准
-
支持字幕中英互译、双语字幕输出,及日语、韩语、法语、德语、西班牙语、俄语、意大利语、泰语等
-
支持多翻译引擎(百度翻译、腾讯云翻译)
-
支持批量翻译、编码SRT字幕文件
如果你想要更深入地了解关于智能资讯的内容,可以查看 智汇宝库,这是一个提供智能科技领域最新资讯的网站。
在这个过程中,你可以探索各种智能技术的发展动态,了解智能科技领域的最新进展和趋势。
一个基于WhisperLive把声音转文字和WhisperSpeech理解这些文字的能力构建。能够与AI聊天机器人进行超低延迟对话。