V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
andyskaura
4.64D
V2EX  ›  分享创造

将影片自动转录出字幕,并翻译的本地应用

  •  
  •   andyskaura · 12 小时 38 分钟前 · 383 次点击
    前几天看到 v 友分享的字幕翻译工具,想想我迫切需要的功能是 生成外语影片中文字幕 功能。
    于是调研了下方案,原本打算古法编程的。
    但 gpt5.4 真的远超想象,没那么完美,但已符合我的需求,解决了某些电影字幕无->有的跨越。

    核心功能:
    ffmpeg 分离音频->VAD 本地模型降噪切片->Whisper 本地模型转录(非翻译)->LLM 大模型翻译

    分享给有需要的 v 友
    https://github.com/AndySkaura/crosssubtitle-ai/releases/tag/1.0
    当前只有 mac arm 版本,win 版本等下周 codex 有额度了再督促它干活儿。
    只在本机进行过测试

    原本想内置一个 qwen 7b ,但还是太重了,不如用免费不限量的 GLM-4-Flash-250414 。有条件的自己本地部署个小模型吧。
    6 条回复    2026-03-20 00:29:20 +08:00
    Daybyedream
        1
    Daybyedream  
       12 小时 28 分钟前
    我现在转文字都白嫖千问 APP 里的 视频都不传直接提取音频发过去还是很快处理好的。
    andyskaura
        2
    andyskaura  
    OP
       12 小时 0 分钟前
    @Daybyedream 大模型还是太权威了 我用 Whisper 本地识别,如果不做降噪和切片,和上下文优化,识别准度还差很大意思
    arcsin1
        3
    arcsin1  
       10 小时 44 分钟前
    Whisper 本地识别 只能做些简单的。毕竟量不够
    wednesdayco
        4
    wednesdayco  
       9 小时 36 分钟前
    ?我刚给我对象弄了一个这个的 demo
    cairnechen
        5
    cairnechen  
       9 小时 34 分钟前
    memo ?
    indexError
        6
    indexError  
       3 小时 55 分钟前 via Android
    先别写了 认真的,再去做做调查
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   977 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 22ms · UTC 20:24 · PVG 04:24 · LAX 13:24 · JFK 16:24
    ♥ Do have faith in what you're doing.