20221125使用PR2023自动识别obs-studio录屏生成的MKV视频的字幕

20221125使用PR2023自动识别obs-studio录屏生成的MKV视频的字幕
2022/11/25 19:07

01 obs.png

obs studio (64bit)


02 obs 设置.png

03 obs 输出.png

04 obs默认为MKV.png

05 obs改mkv为MP4.png

警告:如果文件无法完成(例如,由于蓝屏BSOD,掉电等),保存到MP4/MOV的记录将无法恢复。如果要录制多个音轨,请考虑使用MKV录制,并在完成后将录像重新封装为MP4/MOV(文件→录像转封装)

06 obs录像转封装.png

07 obs转换封装.png

08 obs转换封装2.png

09转换封装中.png

10转换封装完成.png

转封装完成
录像已经转封装
确定

11PR导入文件.png

导入文件

12导入文件的效果图.png

13PR转录序列.png

14 PR转录音频数据.png

正在创建自动转录……
正在渲染音频数据

14PR转录简体中文.png

创建转录文本
语言:简体中文(默认锁定为为英文,这里有个不好,不会记住上次的语言)
 

16PR识别完成.png

开始时间:2022-11-24的13:57
结束时间:2022-11-24的16:47
视频4小时23分钟,大概4.5小时,大概需要3小时识别完成。

17创建说明性字幕.png

创建说明性字幕

18从序列转录创建.png

创建字幕

19正在创建字幕.png

20生成字幕完成.png

21导出到SRT文件.png

22SRT.png

方法二:MKV→MKA→MP4(只有音频的视频文件)

31 MKV.png

https://mkvtoolnix.download/downloads.html#windows
https://www.fosshub.com/MKVToolNix.html

32导入MKV.png

开始混流

33 MKV2mka.png

34 ffmpeg1.png

ffmpeg -i "2022-07-02 13-10-13.mka" -acodec copy  "2022-07-02 13-10-13.mp4"

Microsoft Windows [版本 10.0.19044.1889]
(c) Microsoft Corporation。保留所有权利。

C:\Users\ASUS>cd C:\AI-OCR

C:\AI-OCR>
C:\AI-OCR>ffmpeg -i "2022-07-02 13-10-13.mka" -acodec copy  "2022-07-02 13-10-13.mp4"
ffmpeg version N-106352-g2a1eae2179-20220319 Copyright (c) 2000-2022 the FFmpeg developers
  built with gcc 11.2.0 (crosstool-NG 1.24.0.533_681aaef)
  configuration: --prefix=/ffbuild/prefix --pkg-config-flags=--static --pkg-config=pkg-config --cross-prefix=x86_64-w64-mingw32- --arch=x86_64 --target-os=mingw32 --enable-gpl --enable-version3 --disable-debug --disable-w32threads --enable-pthreads --enable-iconv --enable-libxml2 --enable-zlib --enable-libfreetype --enable-libfribidi --enable-gmp --enable-lzma --enable-fontconfig --enable-libvorbis --enable-opencl --disable-libpulse --enable-libvmaf --disable-libxcb --disable-xlib --enable-amf --enable-libaom --enable-avisynth --enable-libdav1d --enable-libdavs2 --disable-libfdk-aac --enable-ffnvcodec --enable-cuda-llvm --enable-frei0r --enable-libgme --enable-libass --enable-libbluray --enable-libmp3lame --enable-libopus --enable-librist --enable-libtheora --enable-libvpx --enable-libwebp --enable-lv2 --enable-libmfx --enable-libopencore-amrnb --enable-libopencore-amrwb --enable-libopenh264 --enable-libopenjpeg --enable-libopenmpt --enable-librav1e --enable-librubberband --enable-schannel --enable-sdl2 --enable-libsoxr --enable-libsrt --enable-libsvtav1 --enable-libtwolame --enable-libuavs3d --disable-libdrm --disable-vaapi --enable-libvidstab --enable-vulkan --enable-libshaderc --enable-libplacebo --enable-libx264 --enable-libx265 --enable-libxavs2 --enable-libxvid --enable-libzimg --enable-libzvbi --extra-cflags=-DLIBTWOLAME_STATIC --extra-cxxflags= --extra-ldflags=-pthread --extra-ldexeflags= --extra-libs=-lgomp --extra-version=20220319
  libavutil      57. 24.101 / 57. 24.101
  libavcodec     59. 25.100 / 59. 25.100
  libavformat    59. 20.101 / 59. 20.101
  libavdevice    59.  6.100 / 59.  6.100
  libavfilter     8. 29.100 /  8. 29.100
  libswscale      6.  6.100 /  6.  6.100
  libswresample   4.  6.100 /  4.  6.100
  libpostproc    56.  5.100 / 56.  5.100
Input #0, matroska,webm, from '2022-07-02 13-10-13.mka':
  Metadata:
    encoder         : libebml v1.4.4 + libmatroska v1.7.1
    creation_time   : 2022-11-24T08:54:07.000000Z
  Duration: 04:23:37.92, start: 0.000000, bitrate: 137 kb/s
  Stream #0:0: Audio: aac (LC), 48000 Hz, stereo, fltp (default)
    Metadata:
      title           : simple_aac_recording
      BPS             : 136245
      DURATION        : 04:23:37.920338304
      NUMBER_OF_FRAMES: 741465
      NUMBER_OF_BYTES : 269389856
      _STATISTICS_WRITING_APP: mkvmerge v72.0.0 ('Minuano (Six-eight)') 64-bit
      _STATISTICS_WRITING_DATE_UTC: 2022-11-24 08:54:07
      _STATISTICS_TAGS: BPS DURATION NUMBER_OF_FRAMES NUMBER_OF_BYTES
Output #0, mp4, to '2022-07-02 13-10-13.mp4':
  Metadata:
    encoder         : Lavf59.20.101
  Stream #0:0: Audio: aac (LC) (mp4a / 0x6134706D), 48000 Hz, stereo, fltp (default)
    Metadata:
      title           : simple_aac_recording
      BPS             : 136245
      DURATION        : 04:23:37.920338304
      NUMBER_OF_FRAMES: 741465
      NUMBER_OF_BYTES : 269389856
      _STATISTICS_WRITING_APP: mkvmerge v72.0.0 ('Minuano (Six-eight)') 64-bit
      _STATISTICS_WRITING_DATE_UTC: 2022-11-24 08:54:07
      _STATISTICS_TAGS: BPS DURATION NUMBER_OF_FRAMES NUMBER_OF_BYTES
Stream mapping:
  Stream #0:0 -> #0:0 (copy)
Press [q] to stop, [?] for help
size=  267995kB time=04:23:37.92 bitrate= 138.8kbits/s speed=3.76e+03x
video:0kB audio:263076kB subtitle:0kB other streams:0kB global headers:0kB muxing overhead: 1.869737%

C:\AI-OCR>

35 ffmpeg2.png

36 pr 导入 音频.png

37 转录序列.png

38 序列2.png

39PR识别完成.png

40转换SRT‘.png

41导入MKV.png

42不认识格式.png

文件导入失败

猜你喜欢

转载自blog.csdn.net/wb4916/article/details/128043198