Bili2text:B 站影片一鍵轉文字開源神器
Bili2text 是一款針對Bilibili 平台深度客製化的視訊轉文字工具。它將繁瑣的視訊下載、音訊擷取與語音辨識整合進單一流程,使用者只需提供視訊的AV 號,即可在無需手動幹預的情況下,快速獲得精準的文字轉錄結果。
該工具的核心競爭力在於整合了OpenAI 的 Whisper 模型,能夠將高清視訊中的語音高效轉換為可編輯的文字,極大降低了記錄視訊內容的成本。
核心功能解析
1. 高效率影片下載
Bili2text 透過FFmpeg 的串流媒體拉取能力,能夠繞過瀏覽器的常規限制直接抓取Bilibili 影片檔案。無論是多P 影片或1080P 以上的高清畫質均能良好相容,並支援透過you-get 等下載器擴充格式支援。
2. 智慧音訊處理
為了優化磁碟空間和處理速度,工具在下載後會立即使用FFmpeg 擷取純音軌,並剔除冗餘的影像資料。針對大文件,腳本會自動將音軌切分為小段並行識別,在有效降低顯存佔用的同時,顯著提升轉錄效率。
3. 高精度語音轉寫
依托OpenAI Whisper 模型,Bili2text 在多語言辨識精度上處於領先地位。得益於大規模弱監督資料的訓練,即便在零樣本場景下也能維持穩定的輸出品質。目前,社區已提供升級至 Whisper-large-v3 的版本及GUI 圖形介面,進一步降低了使用門檻。
適用場景
- 內容創作 :快速擷取影片腳本,用於字幕校對、文案二創或剪輯參考。
- 學術與教育 :將線上課件、學術講座轉化為可搜尋的文字講義或學習筆記。
- 語料採集 :大量將訪談、演講等音訊資源轉化為文字語料庫。
安裝與使用步驟
- 克隆代碼倉庫
透過Git 將專案下載到本地並進入目錄:
git clone https://github.com/lanbinshijie/bili2text.git cd bili2text - 配置運作環境
安裝專案所需的Python 依賴函式庫:
pip install -r requirements.txt - 啟動轉錄流程
你可以選擇以下兩種方式之一來運行工具:
方式A:命令列模式
運行python main.py,隨後根據提示輸入影片的AV 號即可開始。方式B:GUI 圖形介面
運行python window.py,在彈出的視窗中輸入視訊連結(程式會自動將其轉換為AV 號),點擊下載按鈕即可完成轉換。
相關資源
專案GitHub 地址:https://github.com/lanbinleo/ bili2text


