主要内容

spectralCentroid

频谱质心为音频信号和听觉谱图

自从R2019a

描述

例子

重心= spectralCentroid (x,f)返回信号的频谱重心,x随着时间的推移。函数如何解释x取决于的形状f

例子

重心= spectralCentroid (x,f,名称=值)使用一个或多个名称参数指定选项。

例子

spectralCentroid (___)没有输出参数的谱形心情节。您可以指定一个输入组合的任何以前的语法。

  • 如果输入是在时域频谱质心与时间绘制。

  • 如果输入是在频域,频谱质心策划反对帧数。

例子

全部折叠

读入一个音频文件并使用缺省参数计算质心。

[audioIn, fs] = audioread (“Counting-16-44p1-mono-15secs.wav”);质心= spectralCentroid (audioIn, fs);

绘制质心与时间。

spectralCentroid (audioIn fs);

图包含一个坐标轴对象。坐标轴对象包含时间(s), ylabel质心(Hz)包含一个类型的对象。

读入一个音频文件,然后女士缓冲信号与20 30 ms帧重叠。计算八度使用的功率谱poctave函数。

[audioIn, fs] = audioread (“Counting-16-44p1-mono-15secs.wav”);audioBuffered =缓冲区(audioIn,圆(fs * 0.03),圆(fs * 0.02),“nodelay”);[p, cf] = poctave (audioBuffered fs);

八度的质心计算功率谱。

重心= spectralCentroid (p, cf);

针对帧数的重心。

spectralCentroid (p, cf)

图包含一个坐标轴对象。坐标轴对象包含框架,ylabel质心(Hz)包含一个类型的对象。

读入一个音频文件。

[audioIn, fs] = audioread (“Counting-16-44p1-mono-15secs.wav”);

计算功率谱的重心。计算质心50毫秒汉明窗的数据与25 ms重叠。使用范围从62.5赫兹fs/ 2的质心计算。

质心= spectralCentroid (audioIn fs,窗口=汉明(圆(0.05 * fs)),OverlapLength = (0.025 * fs),范围= [62.5,f / 2]);

绘制质心与时间。

spectralCentroid (audioIn fs,窗口=汉明(圆(0.05 * fs)),OverlapLength = (0.025 * fs),范围= (62.5,f / 2))

图包含一个坐标轴对象。坐标轴对象包含时间(s), ylabel质心(Hz)包含一个类型的对象。

创建一个dsp.AudioFileReader对象读取音频数据帧。创建一个dsp.SignalSink记录频谱质心计算。

fileReader = dsp.AudioFileReader (“Counting-16-44p1-mono-15secs.wav”);记录器= dsp.SignalSink;

在一个音频流循环:

  1. 读取音频数据的帧。

  2. 计算帧的频谱质心的音频。

  3. 日志后绘制的频谱质心。

计算频谱质心只有一个给定的输入框,指定一个窗口与相同数量的样本作为输入,并将重叠长度设置为零。

情节记录的数据。

~结束(fileReader) audioIn = fileReader ();质心= spectralCentroid (audioIn fileReader.SampleRate,“窗口”汉明(大小(audioIn,1)),“OverlapLength”,0);记录器(重心)结束情节(logger.Buffer) ylabel (“重心(Hz)”)

图包含一个坐标轴对象。坐标轴对象ylabel质心(Hz)包含一个类型的对象。

如果输入你的音频流循环变量samples-per-frame,不一致samples-per-frame分析窗口的大小spectralCentroid,或者如果你想计算重叠的频谱质心数据,使用dsp.AsyncBuffer

创建一个dsp.AsyncBuffer对象,重置记录器和发布的文件阅读器。

浅黄色= dsp.AsyncBuffer;重置(logger)释放(fileReader)

指定50毫秒帧的频谱质心计算25 ms重叠。

fs = fileReader.SampleRate;samplesPerFrame =圆(fs * 0.05);samplesOverlap =圆(fs * 0.025);samplesPerHop = samplesPerFrame - samplesOverlap;赢得=汉明(samplesPerFrame);~结束(fileReader) audioIn = fileReader ();写(浅黄色,audioIn);迷。NumUnreadSamples >= samplesPerHop audioBuffered = read(buff,samplesPerFrame,samplesOverlap); centroid = spectralCentroid(audioBuffered,fs,“窗口”,赢了,“OverlapLength”,0);记录器(重心)结束结束发行版(fileReader)

情节记录的数据。

情节(logger.Buffer) ylabel (“重心(Hz)”)

图包含一个坐标轴对象。坐标轴对象ylabel质心(Hz)包含一个类型的对象。

输入参数

全部折叠

输入信号,指定为一个向量,矩阵,或三维数组。函数如何解释x取决于的形状f

数据类型:|

采样率和频率在赫兹矢量,分别指定为一个标量或矢量。函数如何解释x取决于的形状f:

  • 如果f是一个标量,x是解释为一个时域信号,f解释为采样率。在这种情况下,x必须是一个真正的向量或矩阵。如果x被指定为一个矩阵,列是解释为个人渠道。

  • 如果f是一个矢量,x是解释为频域信号,f被解释为频率,在赫兹,对应的行吗x。在这种情况下,x必须是一个真正的l——- - - - - -——- - - - - -N数组,l是在给定频率的谱值的数量吗f,是个体数量的光谱,N通道的数量。

  • 的行数x,l,必须等于要素的数量f

数据类型:|

名称-值参数

指定可选的双参数作为Name1 = Value1,…,以=家,在那里的名字参数名称和吗价值相应的价值。名称-值参数必须出现在其他参数,但对的顺序无关紧要。

R2021a之前,用逗号来分隔每一个名称和值,并附上的名字在报价。

例子:窗口=汉明(256)

请注意

适用以下名称参数x是一种时域信号。如果x是一个频域信号,名称参数被忽略。

应用于时域窗口,指定为一个真正的向量。向量中的元素的数量必须在[1,大小(x,1)]。向量中的元素的数量也必须大于OverlapLength

数据类型:|

数量的样本之间的重叠相邻窗口,指定为一个整数范围在[0,大小(窗口,1))。

数据类型:|

使用的箱子数量计算DFT的窗口的输入样本,指定为一个积极的标量整数。如果未指定的,FFTLength默认为元素的数量窗口

数据类型:|

在赫兹频率范围,指定为一个双元素的行向量增加实际价值范围在[0,f/ 2)。

数据类型:|

光谱类型,指定为“权力”“级”:

  • “权力”——单边功率谱谱形心计算。

  • “级”——片面的频谱质心计算级频谱。

数据类型:字符|字符串

输出参数

全部折叠

频谱质心在赫兹,作为一个标量,返回向量或矩阵。每一行的重心对应于频谱质心的一个窗口x。每一列的重心对应于一个独立的通道。

算法

中描述的频谱质心计算[1]:

重心 = k = b 1 b 2 f k 年代 k k = b 1 b 2 年代 k

在哪里

  • fk是赫兹的频率对应于本吗k

  • 年代k在本是光谱值吗k

  • b1b2乐队边缘,在垃圾箱,计算频谱质心。

引用

[1]彼得斯,G。“大量的音频声音特性描述(相似性和分类)小心”项目。Technical Report; IRCAM: Paris, France, 2004.

扩展功能

C / c++代码生成
生成C和c++代码使用MATLAB®编码器™。

GPU数组
加速代码运行在一个图形处理单元(GPU)使用并行计算工具箱™。

版本历史

介绍了R2019a