本文主要讲解FFmpeg的音频编码具体流程，API使用。最后再以一个非常简单的demo演示将一个音频原始数据pcm文件编码为AAC格式的音频文件。本文主要基于FFmpeg音频编码新接口。

一、FFmpeg音频编码API调用流程图

音频编码的API调用流程图如下：

API接口简单大体讲解如下：

av_register_all()：注册FFmpeg所有编解码器。
 
avformat_alloc_context()：初始化输出码流的AVFormatContext。
 
avio_open()：打开输出文件。
 
av_new_stream()：创建输出码流的AVStream。
 
avcodec_find_encoder()：查找编码器。
 
avcodec_open2()：打开编码器。
 
avformat_write_header()：写文件头（对于某些没有文件头的封装格式，不需要此函数。比如说MPEG2TS）。
 
avcodec_send_frame()：编码核心接口新接口，发送一帧音频给编码器。即是AVFrame（存储PCM数据）。
 
avcodec_receive_packet()：编码核心接口新接口，接收编码器编码后的一帧音频，AVPacket（存储AAC等格式的数据）。
 
av_write_frame()：将编码后的音频数据写入文件。
 
flush_encoder()：输入的像素数据读取完成后调用此函数。用于输出编码器中剩余的AVPacket。
 
av_write_trailer()：写文件尾（对于某些没有文件头的封装格式，不需要此函数。比如说MPEG2TS）。

从上面可以看到，其实音频的编码流程基本与视频的编码流程一致。

二、音频编码过程API调用流程

1、注册各大组件

这一步是ffmpeg的任何程序的第一步都是需要先注册ffmpeg相关的各大组件的：

    //注册各大组件
    av_register_all();

2、打开pcm原始数据文件

这里除了打开pcm原始数据文件外，还定义了一个framenum变量，这个是为了简单验证需要，我们只编码framenum帧，不然若pcm太大，编码太久，可以指定自己想要的多少帧来做验证即可，赋值framenum。

    FILE *in_file=NULL;	                        //Raw PCM data
    in_file= fopen(inputPath, "rb");

    int framenum=10000;                          //Audio frame number

3、初始化输出码流的AVFormatContext

与视频一样，有两种方式，这里我们用的方式一。

方式一：

    //方式1
    pFormatCtx = avformat_alloc_context();
    //Guess Format
    fmt = av_guess_format(NULL, outputPath, NULL);
    pFormatCtx->oformat = fmt;

方式二：

    //方式2
    avformat_alloc_output_context2(&pFormatCtx, NULL, NULL, out_file);
    fmt = pFormatCtx->oformat;

4、打开输出文件

    //Open output
    if (avio_open(&pFormatCtx->pb,outputPath, AVIO_FLAG_READ_WRITE) < 0){
        LOGE("Failed to open output file!");
        return false;
    }

5、创建输出码流的AVStream

    audio_st = avformat_new_stream(pFormatCtx, 0);
    if (audio_st==NULL){
        return false;
    }

6、查找编码器并打开

查找编码器之前，需要先指定配置编码器的一些参数。像音频的话，比如它的采样率，声道数，编码格式等，需要配置输入的PCM的原始数据的参数，也需要配置编码后输出的数据的参数。如下，我们这里参数的设定是输入的PCM是44100，FLT，STEREO，输出AAC是44100，FLTP，STEREO：

    //{ 这个参数的设定是输入的PCM是44100，FLT，STEREO，输出AAC是44100，FLTP，STEREO
    pCodecCtx = audio_st->codec;
    pCodecCtx->codec_id = fmt->audio_codec;
    pCodecCtx->codec_type = AVMEDIA_TYPE_AUDIO;
    pCodecCtx->sample_fmt = AV_SAMPLE_FMT_FLTP;
    pCodecCtx->sample_rate= 44100;
    pCodecCtx->channel_layout=AV_CH_LAYOUT_STEREO;
    pCodecCtx->channels = av_get_channel_layout_nb_channels(pCodecCtx->channel_layout);
    pCodecCtx->bit_rate = 64000;
    pCodecCtx->profile=FF_PROFILE_AAC_MAIN;
    pCodecCtx->strict_std_compliance = FF_COMPLIANCE_EXPERIMENTAL;
    //Show some information
    av_dump_format(pFormatCtx, 0, outputPath, 1);

    swr = swr_alloc();
    av_opt_set_int(swr, "in_channel_layout",  AV_CH_LAYOUT_STEREO, 0);
    av_opt_set_int(swr, "out_channel_layout", AV_CH_LAYOUT_STEREO,  0);
    av_opt_set_int(swr, "in_sample_rate",     44100, 0);
    av_opt_set_int(swr, "out_sample_rate",    44100, 0);
    av_opt_set_sample_fmt(swr, "in_sample_fmt",  AV_SAMPLE_FMT_FLT, 0);
    av_opt_set_sample_fmt(swr, "out_sample_fmt", AV_SAMPLE_FMT_FLTP,  0);
    swr_init(swr);
    //}

这里中间我们也使用了av_dump_format()这个API，打印出配置后的参数格式，方便调试查看。

    //Show some information
    av_dump_format(pFormatCtx, 0, outputPath, 1);

参数配置好后调用avcodec_find_encoder寻找编码器

    pCodec = avcodec_find_encoder(fmt->audio_codec);
    if (!pCodec){
        LOGE("Can not find encoder!");
        return false;
    }

最后打开编码器

    ret = avcodec_open2(pCodecCtx, pCodec,NULL);
    if (ret < 0){
        LOGE("Failed to open encoder!");
        return false;
    }

7、写文件头

对于某些没有文件头的封装格式，不需要此函数。

    //Write Header
    avformat_write_header(pFormatCtx,NULL);

8、开始音频编码

准备就绪后，我们就可以开始编码。音频编码的新接口同样是通过发送给编码器，然后接收的方式进行编码。编码的核心代码如下：

        ret = avcodec_send_frame(pCodecCtx, pFrame);
        if (ret < 0){
            LOGE("Error sending a frame for encoding");
            return false;
        }

        while (ret >= 0){
            ret = avcodec_receive_packet(pCodecCtx, pkt);
            if (ret == AVERROR(EAGAIN) || ret == AVERROR_EOF){
                break;
            }
            else if (ret < 0){
                LOGE("Error during encoding\n");
                break;
            }

            ret = av_write_frame(pFormatCtx, pkt);
            av_packet_unref(pkt);
        }

9、读取PCM原数据文件，编码，写入文件

我们一帧一帧地读取PCM原数据文件，然后进行编码，拿到编码后的数据通过av_write_frame写入文件。

ret = av_write_frame(pFormatCtx, pkt);

同时为了确保数据齐全，获取到最后数据的时候，需要将缓冲区中的数据清理出来

    //Flush Encoder
    ret = audio_flush_encoder(pFormatCtx,0);
    if (ret < 0) {
        LOGE("Flushing encoder failed");
        return false;
    }

完整的编码，写入文件流程如下：

for (i=0; i<framenum; i++){
        //Read PCM data
        if ((ret = fread(frame_buf, 1, size, in_file)) <= 0){
            LOGE("fread pcm raw data failed\n");
            getc(in_file);
            if(feof(in_file)) {
                LOGE(" -> Because this is the file feof!");
                break;
            }
            return false;
        }

        int count=swr_convert(swr, outs,len*4,(const uint8_t **)&frame_buf,len/4);//len 为4096
        pFrame->data[0] =(uint8_t*)outs[0];//audioFrame 是VFrame
        pFrame->data[1] =(uint8_t*)outs[1];

        //pFrame->data[0] = frame_buf;  //PCM Data
        pFrame->pts=i*100;

        ret = avcodec_send_frame(pCodecCtx, pFrame);
        if (ret < 0){
            LOGE("Error sending a frame for encoding");
            return false;
        }

        while (ret >= 0){
            ret = avcodec_receive_packet(pCodecCtx, pkt);
            if (ret == AVERROR(EAGAIN) || ret == AVERROR_EOF){
                break;
            }
            else if (ret < 0){
                LOGE("Error during encoding\n");
                break;
            }

            ret = av_write_frame(pFormatCtx, pkt);
            av_packet_unref(pkt);
        }
    }

    //Flush Encoder
    ret = audio_flush_encoder(pFormatCtx,0);
    if (ret < 0) {
        LOGE("Flushing encoder failed");
        return false;
    }

其中audio_flush_encoder其实与视频编码的flush_encoder一样的作用：

int audio_flush_encoder(AVFormatContext *fmt_ctx,unsigned int stream_index){
    int ret;
    int got_frame;
    AVPacket enc_pkt;
    if (!(fmt_ctx->streams[stream_index]->codec->codec->capabilities &
          AV_CODEC_CAP_DELAY))
        return 0;
    while (1) {
        enc_pkt.data = NULL;
        enc_pkt.size = 0;
        av_init_packet(&enc_pkt);
        ret = avcodec_encode_audio2 (fmt_ctx->streams[stream_index]->codec, &enc_pkt,
                                     NULL, &got_frame);
        av_frame_free(NULL);
        if (ret < 0)
            break;
        if (!got_frame){
            ret=0;
            break;
        }
        LOGE("Flush Encoder: Succeed to encode 1 frame!\tsize:%5d\n",enc_pkt.size);
        /* mux encoded frame */
        ret = av_write_frame(fmt_ctx, &enc_pkt);
        if (ret < 0)
            break;
    }
    return ret;
}

10、写文件尾

对于某些没有文件头的封装格式，不需要此步。

    //Write file trailer
    av_write_trailer(pFormatCtx);

11、收尾，释放相关资源

    //Clean
    if (audio_st){
        avcodec_close(audio_st->codec);
        av_free(pFrame);
        av_free(frame_buf);
    }
    avio_close(pFormatCtx->pb);
    avformat_free_context(pFormatCtx);

    fclose(in_file);

以上便是pcm编码为AAC格式的整个流程，可以看到与视频非常相似。若是输出其他编码文件，步骤类似，但是需要调整打开编码器那一步的相关参数。若要做成通用性demo，可以在这一步加上对编码格式的判断，从而进行参数的选择。

三、demo运行

demo中指定了编码的输入文件和输出文件，输入文件是/sdcar/audioIn.pcm，输出文件是/sdcard/audioOut.aac，需要改的话，需要在这里改：

@Override
public void onClick(View view) {
	runOnUiThread(new Runnable() {
		@Override
		public void run() {
			String PATH = Environment.getExternalStorageDirectory().getPath();
			//音频编码
			String input = PATH + File.separator + "audioIn.pcm";
			String output = PATH + File.separator + "audioOut.aac";
			encode_audio(input,output);
			Toast.makeText(MainActivity.this, "音频编码完成，请自行从手机中拉取aac文件", Toast.LENGTH_SHORT).show();
		}
	});
}

测试用的pcm数据文件，可以通过一些设备进行一些录音获取原始数据。或者通过上篇解码的demo先把一个mp3文件给解码为pcm，拿来用。

运行demo，截图如下：

点击“START AUDIO ENCODE”按钮，开始编码。编码过程可能比较久，界面不会有变化，可以通过看log看过程：

编码结束后，界面上会有提示词：“音频编码完成，请自行从手机中拉取aac文件”，同时log也能看到"--- audio encode finished ---"

然后我们看到/sdcard/下已经有编码后的文件，看到编码后的文件比原始pcm文件就要小很多：

我们把它拉取到电脑上，可以看到aac格式的文件，是可以直接用普通音乐播放器播放的，如下，可以打开播放，若音乐播放正常，说明编码过程没有问题。

完整例子已经放到github上，如下

https://github.com/weekend-y/FFmpeg_Android_Demo/tree/master/demo7_audioEncode

FFmpeg音频的编码流程详解及demo

一、FFmpeg音频编码API调用流程图

二、音频编码过程API调用流程

1、注册各大组件

2、打开pcm原始数据文件

3、初始化输出码流的AVFormatContext

4、打开输出文件

5、创建输出码流的AVStream

6、查找编码器并打开

7、写文件头

8、开始音频编码

9、读取PCM原数据文件，编码，写入文件

10、写文件尾

11、收尾，释放相关资源

三、demo运行

目录

一、FFmpeg音频编码API调用流程图

二、音频编码过程API调用流程

1、注册各大组件

2、打开pcm原始数据文件

3、初始化输出码流的AVFormatContext

4、打开输出文件

5、创建输出码流的AVStream

6、查找编码器并打开

7、写文件头

8、开始音频编码

9、读取PCM原数据文件，编码，写入文件

10、写文件尾

11、收尾，释放相关资源

三、demo运行

猜你喜欢

目录

热门文章