信号处理工具librosa中的基本参数解释

librosa官网术语表

  • 时间序列(time series):一种典型的音频信号,用y表示,代表一个一维的浮点数组。y[t]对应数组中位于t点的幅度值。
  • 采样率(sampling rate):时间序列每秒的采样数(值为正整数),由整数变量sr表示。
  • 帧(frame):用于分析目的的的一小段时间序列,通常对应频谱图矩阵的单个列。
  • 窗口(window):计算频谱时,用于加权一个帧内样本的向量或函数。
  • 帧长(frame length):一个分析窗口(或帧)中的样本数(正整数),由整数变量n_fft表示。
  • 跳长(hop length):连续帧之间的样本数,比如频谱图中的列,用一个正整数hop_length表示。
  • 窗口长度(window length):窗函数(比如Hann窗)的长度(宽度)。它可以小于短时傅立叶变换使用的帧长度。通常用正整数变量win_length表示。
  • 频谱图(spectrogram):一个矩阵S,行表示频点(frequency bins),列表示帧(时间)。频谱图既可以是实数也可以是复数。习惯上,实数频谱图用numpy.ndarrays S表示,而复数短时傅里叶变换(STFT)矩阵用D表示。
  • 色度(chroma):也称为音阶曲线(PCP),色度表示测量出的给定的帧(时间)内每个音阶等级(例如音阶中的12个音调)的相对能量。

以上翻译是我根据术语表,结合DeepLGoogle翻译在自己的理解基础上翻译的结果。如果有错误希望大家在评论区指出,可以相互探讨。

猜你喜欢

转载自blog.csdn.net/Roy_Yuan_/article/details/114704608
今日推荐