利用频谱分析实现音乐无缝隙过度 - 代码天地

利用频谱分析实现音乐无缝隙过度

企业开发 2022-06-01 14:54:59 阅读次数: 0

在网文 Algorithm Uses Math to Blend Musical Notes Seamlessly [Video] 中介绍了一篇 MIT 学生 Henderson发表的一篇国际会议论文： AUDIO TRANSPORT: A GENERALIZED PORTAMENTO VIA OPTIMAL TRANSPORT ，实现将两段音乐进行平滑过渡的滑音音效（portamento）。这篇论文在国际数字音效会议中被评为“最佳学生论文”奖。

通常情况下，在两个信号 $f\left( t \right),g\left( t \right)$ 之间进行切换，只需要使用一个插值因子 $\in \left( {0,1} \right)$ ，通过线性插值也可以实现两个信号之间的平滑过渡。 $h\left( t \right) = r \cdot f\left( t \right) + \left( {1 - r} \right) \cdot g\left( t \right)$ 这种切换没有考虑两个信号内部的结构，所以切换过程为一个信号淡出，另一个信号同时淡入。如果考虑到信号本身内部的结构，在平滑过渡中保持这些结构对应关系，可以更好揭示出变化过程对应信息。

比如下来是两张人脸照片，左边是平通的淡入淡出过渡，右边则是将人脸中主要特征点保持空间一致进行过渡。两种过渡方式不同。

▲ 图1 两个人脸图像切换

▲ 图1 两个人脸图像切换

在 MIT 学生 Henderson 论文中，他们提出了一种对音乐声音进行保持频谱结构的过渡算法，使得声音过渡产生特有的“滑音”效果。他们的算法也一改传统的通过音量插值的“淡入淡出”方式完成两个音频转换，而是通过傅里叶变换获得他们频谱结构，并保证在转换过程中频谱结构一致。

具体算法是，首先将两个音频数据都切成 50ms 长度的数据。通过傅里叶变换获得每段数据的频谱，然后通过聚类算法将所有的频率汇聚成独立的合成音符。

以上还都是通常音频数据处理过程。关键步骤在于他们利用了 最优运输 （Optimal Transport）优化算法获得两个音乐频谱结构之间的对应关系。

▲ 图2 在两个音乐过渡过程中，保持其中频谱对应关系

▲ 图2 在两个音乐过渡过程中，保持其中频谱对应关系

下面再根据插值参数 $\in \left( {0,1} \right)$ 确定插值音乐中所有音符对应的频率和幅度，最后再通过傅里叶反变换获得插值后的音频数据。

可以通过一个手动滑柄，或者一个旋转电位器确定两个音乐之间比例参数。这种算法不仅可以在两段不同乐器的音乐之间进行切换，也可以在人声之间，或者人声与乐器之间进行平滑切换。

▲ 图3 两段音乐频谱之间的对应和过渡切换

▲ 图3 两段音乐频谱之间的对应和过渡切换

为了消除切换过程中人为失真痕迹， Henderson 设计了两个关键音频处理算法：

提出了一种频率重新分配（Frequency Reassignment）信号处理技术，将声音频谱进行分配成若干频率段，形成单一音符；
提出了一种音频相位合成算法将相邻 50ms 音频段进行平滑合成，避免窗口之间相互影响。

基于这种算法， Henderson 希望能够进一步改进，实现音乐中的连奏 (legato)效果，即在不同音符之间进行光滑变换，达到一些经典音乐演奏效果。

如果大家感兴趣，可以参见后面他们的论文。

■ 相关文献链接:

● 相关图表链接:

图1 两个人脸图像切换
图2 在两个音乐过渡过程中，保持其中频谱对应关系
图3 两段音乐频谱之间的对应和过渡切换

猜你喜欢

转载自blog.csdn.net/zhuoqingjoking97298/article/details/125070537

利用频谱分析实现音乐无缝隙过度

图像频谱分析

2018.12.2 频谱分析

信号及频谱分析

利用matlab怎样进行频谱分析

利用DFT对连续信号做频谱分析

MATLAB实现正弦频谱分析学习笔记

基于Matlab实现频谱分析（附上源码+数据集）

频谱分析仪

基于Python的频谱分析

FFT频谱分析原理

DFT频谱分析实验

周期信号的频谱分析

matlab频谱分析详解

【转载】STM32F103C8T6 FTT音乐频谱分析与显示

利用Matlab对Excel数据表参数进行频谱分析（FFT）的方法

利用短时傅里叶变换（STFT）对信号进行时频谱分析和去噪声

正弦信号频谱分析实验

基于MATLAB和Python的频谱分析

基于Python的频谱分析（一）

无线电频谱分析

使用 FFT 进行频谱分析

python学习信号频谱分析二

频谱分析仪哪种好？

Specinker 频谱分析引擎库

实验五连续信号的频谱分析

【文献阅读】FedCut 频谱分析

CCS下DSP仿真实现双边带调制与频谱分析（查表法）

FPGA综合系统设计（五）频谱分析系统

FFT_频谱分析（数字信号处理）

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

基本数据类型封装类比较 Java源码解读(一) 8种基本类型对应的封装类型

JS实现无缝滚动上

深入解析HashMap原理（基于JDK1.8）

mysql的连接池

关于.htc

linux下的ubuntu12.04图形界面

【数论】好推不好记的扩展欧几里德

设备树详解

cscope + tags 简单设置

xml学习

每日归档

更多

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)