大神论坛

找回密码
快速注册
查看: 261 | 回复: 0

[原创] whisper 为没有字幕的视频生成字幕,无需联网,本地运行

主题

帖子

0

积分

初入江湖

UID
588
积分
0
精华
威望
0 点
违规
大神币
68 枚
注册时间
2023-09-16 15:08
发表于 2023-10-21 09:59
本帖最后由 tail88 于 2023-10-21 09:59 编辑

作用:为没有字幕的视频生成字幕,无需联网,本地运行

基本步骤:

  1. 安装python

    安装最新版就好

  2. 安装ffmepg

    下载自己系统对应的版本,windows是win64那个,将下载的压缩包解压后得到的ffmpeg.exe ffplay.exe ffprobe.exe放到一个你想放的目录,然后将这个目录的路径加入环境变量的Path里,不知道添加就百度一下

  3. 安装cuda

    安装最新的就好;在下载页面选自己的对应配置就可以下载了

  4. 安装PyTouch

    安装最新的就好; 在下载页面选最新的cuda版本,然后会有一个Run this Command,在cmd运行即可安装;例如:pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121

  5. 安装whisper (附:whisper源页面)

    打开cmd,运行 pip install git+https://github.com/openai/whisper.git就可以安装好了


使用方法:打开cmd -> 输入 whisper 视频路径 --output_format=srt --model=模型名称 就可以开始运行了

  • 视频路径直接把视频拖进来就可以
  • 模型根据自己的配置选,模型越大,显存要求越高,越精确,速度越慢

为了不用每次都输入命令行,所以我写了个py程序,按照上面的步骤安装好后,每次就只要运行这个py程序,拖入视频然后选模型就可以了

import os

videoName = input("请拖入视频:")
model = input("请选择模型(1:tiny 2:base 3:small 4:medium 5:large):")
if(model == "1"):
model = "tiny"
elif(model == "2"):
model = "base"
elif(model == "3"):
model = "small"
elif(model == "4"):
model = "medium"
elif(model == "5"):
model = "large"
else:
model = "small"

print(f"模型:{model}\t转换视频:{videoName}\n现在开始转换...")
cmd = f"whisper {videoName} --output_format=srt --model={model}"

try:
os.system(cmd)
input("转换完成!")
except Exception as e:
print(f"发生错误:{e}")
input("转换失败!")

另外,因为不能生成中文字幕,默认是英文,所以一般是配合potplayer的实时字幕翻译使用。


注:若转载请注明大神论坛来源(本贴地址)与作者信息。

返回顶部