【Gstreamer】PUSH/PULL mode生动解析

gstreamer 在处理资料的流动有两种主要的模式,一个是「推」,一个是「拉」。两种模式需要实作的 routine 不同,在对资料的操作 (manipulation) 上的重点也不一样,很容易被搞得摸不清方向(其实我到现在还是有很多没搞懂的地方…)。首先先解释一下两者的不同。

「推」模式就是由上游的插件控制资料的大小、流速,向下「推」到下游的插件,所以下游的插件并不会事先知道有多少资料会被送进来,它就必须先准备一个缓衝区来承接资料,然后判断缓衝区裡的资料是否足够拆解出一个压缩单位的资料,够的话就把资料切割出一个固定大小送给解码器,剩下的资料要留著和下一笔流进来的资料做连接。


「拉」模式则是需要自己控制资料大小、流速,告诉上游的插件说自己要多少资料,从几分几秒开始读,自己控制速度、大小等等变数,把资料「拉」进来。因为要流进来的资料量 (举例来说,media-object 的 size、chunk size、packet size) 自己可以控制,就不需要设计一个缓衝区来放资料。

通常,「拉」模式会用在 demuxer,而「推」模式用在其他插件,所以 gst-template 提供的例子是「推」模式的写法。_chain() 函式就是让上游插件把资料送进来的接口,当资料开始流动的时候 (完成启动阶段(activation stage)后,启动的部份留待后述。) 会直接唤起初始阶段时向 pad 注册的 chain 函式,这个函式的介面 (GstPadChainFunction) 是已经被定义好的,其中一个变数是 GstBuffer 的指标,资料就被塞在这个指标所指向的记忆体空间。我们便可以透过注册进去的函式,取得操作这段资料的 handle 。

Gstreamer 在处理资料流有四个状态:Null, Ready, Pause, Playing 按顺序切换。也就是说,刚开始播放一个档案时状态变化是: Null –> Ready –> Pause –> Playing,当播放结束要释放 pipeline 的顺序就是原路走回去:Playing –> Pause –> Ready –> Null。我们写的这个 mp3dec 插件是要把 mpeg audio decoder libmad 包装为 gstreamer 插件,所以在开始播放档案之前必须先把插件初始化 (比如说,设定 member variable 的初始值,初始化 gstreamer 的其他元件等等),当然,也要先初始化 libmad。初始化的动作一般来说,应该要放在 Null 转到 Ready 的阶段,或 Ready 转到 Pause 的阶段,绝对不可能是在 Pause 转到 Playing 的阶段,因为 Pause 和 Playing 两个状态是切换播放模式用的 (如:暂停、快进、Seeking) 。


为了处理刚提到的状态切换,我们要注册一个 _change_state() 函式。


 1: static GstStateChangeReturn
 2: gst_mp3dec_change_state(GstElement* element, GstStateChange transition)
 3: {
 4: GstStateChangeReturn ret = GST_STATE_CHANGE_SUCCESS;
 5: Gstmp3dec *dec;
 6: dec = GST_MP3DEC(element);
 7: 
 8: switch(transition)
 9: {
 10: case GST_STATE_CHANGE_NULL_TO_READY:
 11: mad_frame_init(&dec->frame);
 12: mad_stream_init(&dec->stream);
 13: mad_synth_init(&dec->synth);
 14: break;
 15: default:
 16: break;
 17: }
 18: 
 19: ret = parent_class->change_state(element, transition);
 20: if(ret == GST_STATE_CHANGE_FAILURE)
 21: return ret;
 22: 
 23: switch(transition)
 24: {
 25: case GST_STATE_CHANGE_READY_TO_NULL:
 26: gst_mp3dec_reset(dec);
 27: break;
 28: default:
 29: break;
 30: }
 31: return ret;
 32: }
 33: 
 34: static void gst_mp3dec_clas_init()
 35: {
 36: ...
 37: gstelement_class->change_state = gst_mp3dec_change_state;
 38: ...
 39: }
如刚所说,当状态从 NULL 转到 READY 时 (GST_STATE_CHANGE_NULL_TO_READY),插件要做初始化,配置记忆体等。反过来当状态从READY转到NULL时 (GST_STATE_CHANGE_READY_TO_NULL),就要释放资源。为了避免当主要的执行续(main thread)还在运作时,就因为收到「停止」的指令,从 PLAYING 切进 NULL ,把资源都给释放掉,所以状态转换要分成两个 switch-case 来处理。
我们可以试著讨论一下 pipeline 如此处理状态切换的理由是什麽。想像你手上有一个滤水器,一个水桶的污水和一个乾淨的水壶。当你要开始过滤污水的时候,你会不会先检查水壶已经正确地接在滤水器的另一端了?要开始把污水往下倒时,会不会先把滤水器的开关打开,会吧?水壶和滤水器都「READY」了以后,才开始把污水往下倒。如果你使用滤水器的方法和我不同,请麻烦接受这个「由下而上READY」的想法,因为这是 gstreamer 在做开关控制的精神。
反过来看,如果要停止滤水,该是怎样的顺序?没错,把上面过滤的顺序反过来。先停止倒污水,再关闭滤水器,最后才盖上水壶。这样的流程要怎麽用程式码表达呢?

Gstreamer 只提供了一个函式来处理整个 pipeline 开始和结束的动作,在 mp3dec 这个例子中,就是我们注册进去的 gst_mp3dec_change_state。只有一个函式的话,还要兼顾「开的时候下游先开,关的时候上游先关」的原则,最简单的做法就是:播放初始时先替自己做初始化,准备好了以后通知上游。播放结束时先通知上游,再释放自己的资源。所以,就会出现上面那段程式码的写法。

当 pipeline 的状态被切换到 PLAYING 的时候,gstreamer 会开始做 preroll (提取影音资料进缓衝区),此时 _chain() 函式就会被触发。主要的资料处理工作就是在 _chain() 裡完成,在「拉」模式的情况下,主要的资料处理工作则是在 _loop() 裡完成,以后会说明。因为 _chain() 裡面牵涉到 mpeg audio 解码的程式,和 libmad 调用的部份、处理缓衝伫列等等比较複杂,将另开篇幅说明。

还不知道 pad 是什麽没关系,先想像它是插件的「开口」就好;所谓的 pipeline 的箭头是有方向性的,资料从源头 (档案、网路…等) 读取出来后,从读取的插件开始(即:file-source),到播送的插件出去(即:audio-sink 和 video-sink)。

透过插件的「开口」,资料才能在插件之间流动,就像滤水器的进水阀和出水阀,控制流进流出的水量、速度等等。不过 gstreamer 的水阀比较複杂一点,它必须再去判断多媒体资料流的属性,动态地决定输入的多媒体档案要用哪一个滤水器来承接。在这裡水阀就是GstPad ,而标示水阀的「属性」就是GstCaps。 进水阀我们称为「sink pad」,出水阀我们称为「source pad」,所以按上图来看,file-source 没有「安装」「sink pad」是因为他在进水的那一条路是透过系统的 file I/O 来处理,不属于 gstreamer pad 的范畴;同样的 audio-sink 和 video-sink 没有「安装」「source pad」是因为在播放声音和影像的部份是透过系统的 A/V renderer。而在中间的插件们,最基本的型态是一个进水(后称 sinkpad )一个出水(后称 srcpad ),像 decoder ;而 demuxer 要把 audio/video (或更多,视封装格式而定) 资料拆开给各自的解码器,就会有一个 sinkpad ,多个 srcpad ,因为责任重大,demuxer 写起来也比较複杂。

设定这些属性的目的就跟前述一样,让 gstreamer 在自动产生 pipeline 的时候可以按照我们设定的格式找到正确的插件来处理资料。(想像一下滤水器的进入出入阀标示著这个是滤工业用水、那个是滤农业用水、另一个是滤家庭用水,口径多少、每单位吃水量多少…等等等,如此就算滤水器的功能一样,而相对应的口径、水量不符合,gstreamer 也不会接错。)

下面这段,我觉得真他妈写的好,看来此主真的是研究透彻,台湾人的确软件水平的确要比我们高一些:


然而,这边设定的 caps 只是一个样板,告诉上下插件输入和输出资料的格式及相关属性的「范围」,做为建立 pipeline 时参考的依据,当档案开始播放时,真正的资料流的格式、属性要等解码完才知道( 其实这点我觉得不对,pause之前我认为是这样,因为这个时候没有真正解流或文件,无法得知真正info,此刻只是创建,并未决定。但pause后,其实数据就已经open,并尝试开始解析几帧数据find stream info等操作了,然后根据尝试decode的几帧查找和link 对应的pads.只是clock没有走动,preroll这个时候也没有render,所以没有显示.故play之前所有的pads都已经查找并且连接完毕,如果等play的时候再查找,肯定用户能感觉出来,个人见解 )。换言之,caps 的设定不一定是在 template 裡写死就好,有时要另外动态产生运行时对应的 caps 并指派给 pad ( 包括 sinkpad 和 srcpad )。

设定这些属性的目的就跟前述一样,让 gstreamer 在自动产生 pipeline 的时候可以按照我们设定的格式找到正确的插件来处理资料。(想像一下滤水器的进入出入阀标示著这个是滤工业用水、那个是滤农业用水、另一个是滤家庭用水,口径多少、每单位吃水量多少…等等等,如此就算滤水器的功能一样,而相对应的口径、水量不符合,gstreamer 也不会接错。)


在处理 sinkpad 和 srcpad 的程式都还没写之前就先设定 caps 其实并没有具体的功能,但我觉得这样解释比较不会搞不清楚或混淆 caps 的目的和重要性。
原因很简单,就是 gstreamer 发现 mad 的输出阀 (srcpad) 和 mp3dec 的输入阀 (sinkpad) 的 caps 不符合。所以跑都不跑就直接跳掉了。

猜你喜欢

转载自blog.csdn.net/datamining2005/article/details/80031315