使用 Bili2text 将 Bilibili 视频高效转换为文字的实操步骤

330次阅读

Bili2text 是一款针对 Bilibili 平台深度定制的视频转文字工具。它将繁琐的视频下载、音频提取与语音识别整合进单一流程，用户只需提供视频的 AV 号，即可在无需手动干预的情况下，快速获得精准的文本转录结果。

该工具的核心竞争力在于集成了 OpenAI 的 Whisper 模型，能够将高清视频中的语音高效转换为可编辑的文字，极大降低了记录视频内容的成本。

Bili2text 借助 FFmpeg 的流媒体拉取能力，能够绕过浏览器的常规限制直接抓取 Bilibili 视频文件。无论是多 P 视频还是 1080P 以上的高清画质均能良好兼容，并支持通过 you-get 等下载器扩展格式支持。

为了优化磁盘空间和处理速度，工具在下载后会立即使用 FFmpeg 提取纯音轨，剔除冗余的图像数据。针对大文件，脚本会自动将音轨切分为小段并行识别，在有效降低显存占用的同时，显著提升转录效率。

依托 OpenAI Whisper 模型，Bili2text 在多语言识别精度上处于领先地位。得益于大规模弱监督数据的训练，即便在零样本场景下也能保持稳定的输出质量。目前，社区已提供升级至 whisper-large-v3 的版本及 GUI 图形界面，进一步降低了使用门槛。

内容创作 ：快速提取视频脚本，用于字幕校对、文案二创或剪辑参考。
学术与教育 ：将在线课件、学术讲座转化为可搜索的文字讲义或学习笔记。
语料采集 ：批量将访谈、演讲等音频资源转化为文本语料库。

克隆代码仓库

通过 Git 将项目下载到本地并进入目录：
```
git clone https://github.com/lanbinshijie/bili2text.git
cd bili2text
```
配置运行环境

安装项目所需的 Python 依赖库：
```
pip install -r requirements.txt
```
启动转录流程

你可以选择以下两种方式之一来运行工具：

方式 A：命令行模式
运行 python main.py，随后根据提示输入视频的 AV 号即可开始。

方式 B：GUI 图形界面
运行 python window.py，在弹出的窗口中输入视频链接（程序会自动将其转换为 AV 号），点击下载按钮即可完成转换。

项目 GitHub 地址：https://github.com/lanbinleo/bili2text

正文完

发表至： Windows软件效率工具

2025年7月25日

0

转载说明：除特别说明外，本站原创内容采用 Creative Commons Attribution 4.0 (CC BY 4.0) 许可协议发布，转载请注明来源并保留原文链接。本站部分内容基于公开资料整理，并可能经 AI 技术辅助生成或优化，仅供参考，不构成任何专业建议，请读者自行判断与核实。本站不对第三方资源的可用性、安全性或合法性承担任何责任。

开源微信多开与防撤回补丁：实现消息留存与多账号并行，支持QQ及TIM兼容下载

iOS通话录音工具AudioRecorder中文版：安装指南与兼容性说明

利用 NotebookLM Web Importer 构建个人知识库：从碎片化阅读到结构化存储的 4 个步骤

Launcher 极简启动器：解锁全网付费视频的解析方案

想彻底删除 Windows 10 顽固内置软件？试试开源工具 PyDebloatX

Android端李跳跳（波吉1.0 Beta版）安装与配置指南

ZipZap：集成ChatGPT的免费AI助手，实现划词翻译与高效文本处理

安装 Twitter X v11.49.1-release.0 APK 的详细步骤指南

Mac 上对比两份 PDF 到底哪里不同？试试这款专业级的差异分析工具 PDF Differ