小伙伴们有没有好奇我最近在做什么呢?
作为一个内容创作者,少不了和视频打交道,无论你只是单纯的搬运、整理文稿还是想给自己的视频加上字幕,都没有一款工具能彻底解决所有问题。
卡卡字幕助手(VideoCaptioner)应该是目前最完善的工具了,集下载、AI 翻译、视频合成于一体。但是!它还是没有像 SubtitleEdit 一样的字幕校对和编辑功能,并且下载功能一直抽风。

于是我想要给一个没有字幕的视频加上字幕,就需要先打开cobalt 下载视频,卡卡字幕助手转录字幕和翻译,SubtitleEdit 编辑字幕,最后打开 Adobe Premiere 合成视频。
何等的麻烦!
是可忍熟不可忍!
于是 AI 的大手发力了!我用一个月时间做出来这款集下载、AI 翻译、编辑字幕于一体的开源视频神器 MediaFlow!

下面就由我来向大家一一介绍它的功能。
功能介绍
1. 视频下载
下载视频功能使用的 yt-dlp,支持互联网上绝大多数视频网站,包括 X(Twitter)、Youtube、Bilibili、小红书等。
我还特地为抖音和快手等 yt-dlp 不支持的网站做了适配,包括 Cookie 管理等,费了很大的功夫。实际上我并不需要这些网站的视频,但为了大而全还是做了,后续也拖了不少后腿,只能说是个教训了,应该优先做自己真正有需求的功能。

2. 转录字幕
这方面用的最流行的 Fast Whisper 模型,一开始用的做了 Python 内置引擎,但它的断句有一些问题。于是又下载了 CLI 版本,CLI 可以传递参数,经过不停地调整终于能输出较好的字幕,改了一次又一次,真不容易。
但还有一个潜在的问题,一句话可能过长,因此我加了一个“智能分割”按钮,可以自动分割过长的字幕。

3. AI 翻译
Deepseek 的 API 最便宜,推荐使用这个,并且效果也不错。
需要在“设置”里选择并填写密钥,在 官方网站 购买就行了,一块钱能用好几天!

4. 字幕编辑
这部分是最重的功能,简单来说,你可以在”编辑选中项“里修改字幕具体的内容,在音频波形图里拖动字幕时间长短。

鼠标右键还有更多丰富的功能,比如说识别某段之前没有被转录的音频、智能分割等等。
如果你不是一个完美主义者,也许前三个功能就已经能满足你了。但如果你希望字幕正确且没有瑕疵,这部分功能最重要。
修改完字幕后,就可以点击上面的按钮进行视频合成了。
5. 视频合成
视频合成界面可以调整字幕的各项参数,以及最重要的,添加水印。

到这里,整个功能就完善了。
我原本还想加入 AI 画质高清、视频去水印、OCR 字幕识别等功能,但这些功能不仅使用率低、依赖库庞大,并且没几个人的电脑能跑得动,也就搁置了。

最后,这个项目的桌面版正在打包中,我还得花几天确认正式版没有任何 bug,相信不久就会上线了。
如果你愿意做小白鼠的话,可以直接 下载源码 打包或者加群试试,哈哈。
苦涩的教训:
从 Vibe Coding 的角度来讲,这个项目可以说是失败的,虽然对于我个人使用上来说是成功的。
如果让我再做一次这个项目,我不会再使用 Electron 做前端界面,而是直接使用 Python 做界面。
前后端架构让打包时遇到了巨大的困难,以至于我不得不一遍又一遍地重构。
更糟糕的是 Codex 为了兼容旧架构写了无数的屎山代码,简直是折磨。如果你在使用 Codex 重构,一定要让它强制迁移。

给予 AI 信赖,但也不要被 AI 牵着鼻子走。
未来做项目时,都得先思考一个问题:前端 or 后端?
联系方式
最后,如果你也对 Vibe Coding 感兴趣,欢迎加我入交流群,加好友备注暗号MediaFlow。

如果你愿意支持我,可以使用我的邀请链接注册交易所交易加密货币,或者 加入电报群 一起学习!
(建议两个交易所都注册,都需要用到)
币安 保姆级手把手注册教程:https://blog.blacknico.com/invest/step-by-step-instruction-on-binance/
欧易 OKX 保姆级手把手注册教程:https://blog.blacknico.com/invest/okx-nanny-class-step-by-step-tutorial-registration/
如果你对 Web3/ 区块链 / 币圈感兴趣,我这里有一本超全的手册能够帮助你入门:
https://0xcheshire.gitbook.io/web3/
链上 Web3 钱包省手续费:
🔹 OKX:https://web3.okx.com/ul/joindex?ref=1234567 邀请码 1234567(8 折)
🔹 币安:https://web3.binance.com/referral?ref=RP3AEJ2M 邀请码 RP3AEJ2M(7 折)