H.264中SPS、PPS和IDR

1、简介

       H.264码流第一个 NALU是 SPS(序列参数集Sequence Parameter Set,对应H264标准文档 7.3.2.1 序列参数集的语法进行解析。

       H.264码流第二个 NALU是 PPS(图像参数集Picture Parameter Set,对应H264标准文档 7.3.2.2 序列参数集的语法进行解析。

       H.264码流第三个 NALU 是 IDR(即时解码器刷新),对应H264标准文档 7.3.3 序列参数集的语法进行解析。

       SDP中的H.264的SPS和PPS串,包含了初始化H.264解码器所需要的信息参数,包括编码所用的profile,level,图像的宽和高,deblock滤波器等。

 

2、H2.64中I帧和IDR帧的区别

       IIDR帧都是使用帧内预测的。它们都是同一个东西而已,在编码和解码中为了方便,要首个I帧和其他I帧区别开,所以才把第一个首个I帧叫IDR,这样就方便控制编码和解码流程。IDR帧的作用是立刻刷新,使错误不致传播,从IDR帧开始,重新算一个新的序列开始编码。而I帧不具有随机访问的能力,这个功能是由IDR承担,IDR会导致DPB(参考帧列表——这是关键所在)清空,而I不会。IDR图像一定是I图像,但I图像不一定是IDR图像。一个序列中可以有很多的I图像,I图像之后的图像可以引用I图像之间的图像做运动参考。

       对于IDR帧来说,在IDR帧之后的所有帧都不能引用任何IDR帧之前的帧的内容,与此相反,对于普通的I-帧来说,位于其之后的B-和P-帧可以引用位于普通I-帧之前的I-帧。从随机存取的视频流中,播放器永远可以从一个IDR帧播放,因为在它之后没有任何帧引用之前的帧。但是,不能在一个没有IDR帧的视频中从任意点开始播放,因为后面的帧总是会引用前面的帧。

 

3、SPS和PPS的分离与添加

       在分离H.264码流的时候,直接存储AVPacket后的文件可能是不能播放的。

       如果视音频复用格式是TS(MPEG2 Transport Stream),直接存储后的文件是可以播放的。复用格式是FLV,MP4则不行。经过长时间资料搜索发现,FLV,MP4这些属于“特殊容器”,需要经过以下处理才能得到可播放的H.264码流:

      分离某些封装格式(例如MP4/FLV/MKV等)中的H.264的时候,需要首先写入SPSPPS,否则会导致分离出来的数据没有SPSPPS而无法播放。H.264码流的SPS和PPS信息存储在AVCodecContext结构体的extradata中。需要使用ffmpeg中名称为“h264_mp4toannexb”的bitstream filter(比特流过滤器)处理。有两种处理方式:

(1)使用bitstream filter处理每个AVPacket(简单)

av_bitstream_filter_init(const char * name)
  • 输入参数:比特流过滤器的名字
  • 输出参数:根据比特流过滤器的创建并初始化一个比特流过滤器的上下文

(2)手工添加SPS,PPS(稍微复杂)

       将AVCodecContext的extradata数据经过bitstream filter处理之后得到SPS、PPS,拷贝至每个IDR帧之前。通过查看FFMPEG源代码我们发现,AVPacket中的数据起始处没有分隔符(0x00000001), 也不是0x65、0x67、0x68、0x41等字节,所以可以AVPacket肯定这不是标准的nalu。其实,AVPacket前4个字表示的是nalu的长度,从第5个字节开始才是nalu的数据。所以直接将AVPacket前4个字节替换为0x00000001即可得到标准的nalu数据。

av_bitstream_filter_filter(AVBitStreamFilterContext *bsfc,
    AVCodecContext *avctx, 
    const char *args,
    uint8_t **poutbuf, 
    int *poutbuf_size,
    const uint8_t *buf, 
    int buf_size, 
    int keyframe)
  • 参数1:比特流过滤器的上下文
  • 参数2:avcodeccontext输出流的编码器上下文.。
  • 参数3:指定筛选器配置的参数,可能为空.
  • 参数4:指针被更新以指向过滤缓冲区.
  • 参数5:指针以字节形式更新到已过滤的缓冲区大小.
  • 参数6:包含数据到过滤器的缓冲区
  • 参数7:在字节缓冲区大小
  • 参数8:设置为非零,如果缓冲区对应于一个关键帧数据包

 

猜你喜欢

转载自blog.csdn.net/King_weng/article/details/108264301