Bili2text:B 站视频一键转文字开源神器
Bili2text 是一款针对 Bilibili 平台深度定制的视频转文字工具。它将繁琐的视频下载、音频提取与语音识别整合进单一流程,用户只需提供视频的 AV 号,即可在无需手动干预的情况下,快速获得精准的文本转录结果。
该工具的核心竞争力在于集成了 OpenAI 的 Whisper 模型,能够将高清视频中的语音高效转换为可编辑的文字,极大降低了记录视频内容的成本。
核心功能解析
1. 高效视频下载
Bili2text 借助 FFmpeg 的流媒体拉取能力,能够绕过浏览器的常规限制直接抓取 Bilibili 视频文件。无论是多 P 视频还是 1080P 以上的高清画质均能良好兼容,并支持通过 you-get 等下载器扩展格式支持。
2. 智能音频处理
为了优化磁盘空间和处理速度,工具在下载后会立即使用 FFmpeg 提取纯音轨,剔除冗余的图像数据。针对大文件,脚本会自动将音轨切分为小段并行识别,在有效降低显存占用的同时,显著提升转录效率。
3. 高精度语音转写
依托 OpenAI Whisper 模型,Bili2text 在多语言识别精度上处于领先地位。得益于大规模弱监督数据的训练,即便在零样本场景下也能保持稳定的输出质量。目前,社区已提供升级至 whisper-large-v3 的版本及 GUI 图形界面,进一步降低了使用门槛。
适用场景
- 内容创作 :快速提取视频脚本,用于字幕校对、文案二创或剪辑参考。
- 学术与教育 :将在线课件、学术讲座转化为可搜索的文字讲义或学习笔记。
- 语料采集 :批量将访谈、演讲等音频资源转化为文本语料库。
安装与使用步骤
-
克隆代码仓库
通过 Git 将项目下载到本地并进入目录:
git clone https://github.com/lanbinshijie/bili2text.git cd bili2text -
配置运行环境
安装项目所需的 Python 依赖库:
pip install -r requirements.txt -
启动转录流程
你可以选择以下两种方式之一来运行工具:
方式 A:命令行模式
运行python main.py,随后根据提示输入视频的 AV 号即可开始。方式 B:GUI 图形界面
运行python window.py,在弹出的窗口中输入视频链接(程序会自动将其转换为 AV 号),点击下载按钮即可完成转换。
相关资源
项目 GitHub 地址:https://github.com/lanbinleo/bili2text


