前言
Linux内核版本:4.1.15
主芯片:IMX6ULL
codec芯片:WM8960
一、PCM编码
PCM (Pulse Code Modulation) 是通过等时间隔(即采样率时钟周期)采样将模拟信号数字化的方法。
PCM使用等间隔采样方法,将每次采样的模拟分量幅度表示为N位的数字分量(N = 量化深度),因此PCM方式每次采样的结果都是N bit字长的数据。
CODEC 的本质是 ADC 和 DAC,那么采样率和采样位数就是衡量一款音频CODEC 最重要的指标。比如常见音频采样率有 8K、44.1K、48K、192K 甚至 384K 和 768K,采样位数常见的有 8 位、16 位、24 位、32 位。采样率和采样位数越高,那么音频 CODEC 越能真实的还原声音,也就是大家说的 HIFI。因此大家会看到高端的音频播放器都会有很高的采样率和采样位数,同样的价格也会越高。
PCM信号的两个重要指标是采样频率和量化精度,目前,CD音频的采样频率通常为44100Hz(其他还有8K、44.1K、48K、192K 甚至 384K 和 768K),量化精度是16bit(其他还有 8 位、24 位、32 位)。通常,播放音乐时,应用程序从存储介质中读取音频数据(MP3、WMA、AAC…),经过解码后,最终送到音频驱动程序中的就是PCM数据,反过来,在录音时,音频驱动不停地把采样所得的PCM数据送回给应用程序,由应用程序完成压缩、存储等任务。所以,音频驱动的两大核心任务就是:
playback如何把用户空间的应用程序发过来的PCM数据,转化为人耳可以辨别的模拟音频;
capture把mic拾取到得模拟信号,经过采样、量化,转换为PCM信号送回给用户空间的应用程序;
二、ALSA-PCM中间层
ALSA已经为我们实现了功能强劲的PCM中间层,自己的驱动中只要实现一些底层的需要访问硬件的函数即可。
PCM中间层的代码在include\sound\pcm.h中,提供了许许多多的pcm操作函数,比如创建销毁等等,有兴趣的可以去了解一下。
每个声卡最多可以包含4个pcm的实例,每个pcm实例对应一个pcm设备文件。pcm实例数量的这种限制源于linux设备号所占用的位大小,如果以后使用64位的设备号,我们将可以创建更多的pcm实例。不过大多数情况下,在嵌入式设备中,一个pcm实例已经足够了。
一个pcm实例由一个playback stream和一个capture stream组成,这两个stream又分别有一个或多个substreams组成。
一个pcm实例由一个playback stream和一个capture stream组成,这两个stream又分别有一个或多个substreams组成。

下面一张图列出了pcm中间层几个重要的结构,他可以让我们从uml的角度看一看这列结构的关系,理清他们之间的关系,对我们理解pcm中间层的实现方式。
- snd_pcm是挂在snd_card下面的一个snd_device
- snd_pcm中的字段: streams[2],该数组中的两个元素指向两个snd_pcm_str结构,分别代表playback stream和cpature stream
- snd_pcm_str中的substream字段,指向snd_pcm_substream结构
- snd_pcm_substream是pcm中间层的核心,绝大部分任务都是在substream中处理,尤其是他的
ops (snd_pcm_ops)字段,许多user空间的应用程序通过alsa-lib对驱动程序的请求都是由该结构中的函数处理。它的runtime字段则指向snd_pcm_runtime结构,snd_pcm_runtime记录这substream的
些重要的软件和硬件运行环境和参数。
三、PCM创建流程
pcm逻辑设备的创建流程是在声卡的创建过程中创建的,在machine驱动中有介绍声卡的创建流程。
回顾一下:
devm_snd_soc_register_card->snd_soc_register_card,此函数开始声卡的创建。
在snd_soc_register_card–>snd_soc_instantiate_card–>soc_new_pcm,此函数开始创建PCM逻辑设备
函数原型如下:
int soc_new_pcm(struct snd_soc_pcm_runtime *rtd, int num)
第一个参数为snd_soc_pcm_runtime
第二个参数为创建pcm逻辑设备的个数
在soc_new_pcm调用snd_pcm_new函数开始创建单个的pcm逻辑设备。
函数原型如下:
int snd_pcm_new(struct snd_card *card, const char *id, int device,
int playback_count, int capture_count, struct snd_pcm **rpcm)
{
return _snd_pcm_new(card, id, device, playback_count, capture_count,
false, rpcm);
}
参数含义如下:
- @card: 传入的声卡结构体
- @id: id字符创
- @device: 表示目前创建的是声卡下的第几个pcm,第一个pcm从0开始
- @playback_count: 表示pcm将会有几个playbace substream
- @capture_count:表示pcm将会有几个capture substream
- @rpcm: 存储新的pcm实例的指针
在soc_new_pcm之后就开始了PCM逻辑设备的创建创建历程如下:
snd_pcm_new->_snd_pcm_new->snd_pcm_dev_register->snd_register_device
snd_pcm_new:
int snd_pcm_new(struct snd_card *card, const char *id, int device,
int playback_count, int capture_count, struct snd_pcm **rpcm)
{
return _snd_pcm_new(card, id, device, playback_count, capture_count,
false, rpcm);
}
_snd_pcm_new:
static int _snd_pcm_new(struct snd_card *card, const char *id, int device,
int playback_count, int capture_count, bool internal,
struct snd_pcm **rpcm)
{
struct snd_pcm *pcm;
int err;
static struct snd_device_ops ops = {
.dev_free = snd_pcm_dev_free,
.dev_register = snd_pcm_dev_register,
.dev_disconnect = snd_pcm_dev_disconnect,
};
if (snd_BUG_ON(!card))
return -ENXIO;
if (rpcm)
*rpcm = NULL;
pcm = kzalloc(sizeof(*pcm), GFP_KERNEL);
if (!pcm)
return -ENOMEM;
pcm->card = card;
pcm->device = device;
pcm->internal = internal;
mutex_init(&pcm->open_mutex);
init_waitqueue_head(&pcm->open_wait);
INIT_LIST_HEAD(&pcm->list);
if (id)
strlcpy(pcm->id, id, sizeof(pcm->id));
if ((err = snd_pcm_new_stream(pcm, SNDRV_PCM_STREAM_PLAYBACK, playback_count)) < 0) {
snd_pcm_free(pcm);
return err;
}
if ((err = snd_pcm_new_stream(pcm, SNDRV_PCM_STREAM_CAPTURE, capture_count)) < 0) {
snd_pcm_free(pcm);
return err;
}
if ((err = snd_device_new(card, SNDRV_DEV_PCM, pcm, &ops)) < 0) {
snd_pcm_free(pcm);
return err;
}
if (rpcm)
*rpcm = pcm;
return 0;
}
先创建playback和capture两个substream,最终创建pcm设备,ops最终为pcm的ops,也就是代码中的static struct snd_device_ops ops。
在这里注意一点:
_snd_pcm_new函数会调用snd_pcm_new_stream创建playback和capture两个substream的时候同时在
snd_pcm_new_stream函数中设置其名称:
int snd_pcm_new_stream(struct snd_pcm *pcm, int stream, int substream_count)
{
······
dev_set_name(&pstr->dev, "pcmC%iD%i%c", pcm->card->number, pcm->device,
stream == SNDRV_PCM_STREAM_PLAYBACK ? 'p' : 'c');
······
}
也就是我们在/dev/snd/下可见的PCM逻辑设备:
snd_pcm_dev_register:
static int snd_pcm_dev_register(struct snd_device *device)
{
int cidx, err;
struct snd_pcm_substream *substream;
struct snd_pcm_notify *notify;
struct snd_pcm *pcm;
······
/* register pcm */
err = snd_register_device(devtype, pcm->card, pcm->device,
&snd_pcm_f_ops[cidx], pcm,
&pcm->streams[cidx].dev);
}
······
return err;
}
这里注意snd_pcm_f_ops结构体,如下所示。sound\core\pcm_native.c
该操作函数集被注册在snd_minors结构体的操作函数集中,所以上层应用最终的open,compat_ioctl等函数,最终都会调用到这里。
流程如下: