声源定位算法之GCC-PHAT

其他 2018-05-07 19:43:41 阅读次数: 6

现有的声源定位算法可大致分为三类：ａ）基于时延估计（time-delay estimation，TDE）的算法；ｂ）基于高分辨率谱估计的算法；ｃ）基于稀疏表示的算法。

基于TDE的算法核心在于对传播时延的准确估计，一般通过对麦克风间信号做互相关处理得到。进一步获得声源位置信息，可以通过简单的延时求和、几何计算或是直接利用互相关结果进行可控功率响应搜索等方法。这类算法实现相对简单，运算量小，便于实时处理，因此在实际中运用最广。

GCC-PHAT

基于广义互相关函数的时延估计算法引入了一个加权函数，对互功率谱密度进行调整，从而优化时延估计的性能。根据加权函数的不同，广义互相关函数有多种不同的变形，其中广义互相关-相位变换方法（Generalized Cross Correlation PHAse Transformation，GCC-PHAT）方法应用最为广泛。GCC-PHAT方法本身具有一定的抗噪声和抗混响能力，但是在信噪比降低和混响增强时，该算法性能急剧下降。

1、计算传播时延

阵列中两个麦克风的接收信号为：

相关参数可参见下图：

互相关算法经常被用来做时延估计，表示为：

代入信号模型，则有：

此时因为s(t)和n₁(t)互不相关，上式可以简化为：

其中τ₁₂=τ₁-τ₂，假设n₁和n₂是互不相关的高斯白噪声，则上式可以进一步简化为：

由相关函数的性质可知，当τ₁₂=τ₁-τ₂时，Rx₁x₂(τ)取最大值，是两个麦克风之间的时延。

互相关函数和互功率谱的关系：

在麦克风阵列信号处理实际模型中，由于存在混响和噪声影响，导致Rx₁x₂(τ)的峰值不明显，降低了时延估计的精度。为了锐化Rx₁x₂(τ)的峰值，可以根据信号和噪声的先验知识，在频域内对互功率谱进行加权，从而能抑制噪声和混响干扰。最后进行傅里叶逆变换，得到广义互相关函数Rx₁x₂(τ)：

其中φ₁₂(w)表示频域加权函数。广义互相关时延估计算法框图如下：

2、常用加权函数及其特点

相位变换加权函数的表达式为：

由上式可知，相位变换加权函数实质上是一个白化滤波器，使得信号间的互功率谱更加平滑，从而锐化广义互相关函数。经过PHAT加权之后，Rx₁x₂(τ)广义互相关函数的表达式为：

可以看出，经过PHAT加权的互功率谱近似于单位冲激响应的表达式，突出了时延的峰值，能够有效抑制混响噪声，提高时延估计的精度和准确度。

3、互相关函数

$x (n)$ $x (n)$

两个信号的互相关函数的频域等于x信号频域的共轭乘以Y信号的频域.

猜你喜欢

转载自www.cnblogs.com/ytxwzqin/p/9004603.html

声源定位算法之GCC-PHAT

音视频开发（40）---麦克风阵列声源定位 GCC-PHAT

声源定位之1基本术语

[转]基于TDOA声源定位算法仿真--MATLAB仿真

【声源定位】基于matlab不同空间谱估计的声源定位算法比较【含Matlab源码 545期】

16mic圆形麦克风阵列电路与声源定位算法设计

声源测向: TDOA-GCC-PATH方法

声源定位之3精读《The Generalized Correlation Method for Estimation of Time Delay》

AliOS Things 声源定位应用演示

AliOS Things声源定位应用演示

声纹识别与声源定位（一）

声纹识别与声源定位（二）

【声源定位】基于matlab广义互相关的声源定位【含Matlab源码 548期】

虚拟声源定位系统+环绕声场效果

语音识别（二）——基本框架, Microphone Array, 声源定位

麦克风阵列研究2 声源定位 python界面

人工智能领域中声源定位的研究与发展------第二章声源定位系统 (6)

人工智能领域中声源定位的研究与发展------第二章声源定位系统 (5)

人工智能领域中声源定位的研究与发展------第二章声源定位系统 (4)

人工智能领域中声源定位的研究与发展------第二章声源定位系统 (3)

人工智能领域中声源定位的研究与发展------第二章声源定位系统 (2)

人工智能领域中声源定位的研究与发展------第二章声源定位系统 (1)

【声源定位】基于matlab单声源双麦克风的房间冲激响应【含Matlab源码 547期】

gcc算法

声源分离算法性能评估指标SIR、SDR、SAR

【声源定位】球面散乱数据插值方法/似然估计hybrid spherical interpolation/maximum likelihood (SI/ML) 麦克风阵列声源定位

人工智能领域中声源定位的研究与发展------第三章展望

人工智能领域中声源定位的研究与发展------第一章绪论

自动跟随机器人教程（六）软件部分树莓派声源定位

【声源定位】基于matlab阵列流形矩阵的信号显示【含Matlab源码 549期】

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)