主要内容gydF4y2Ba

mfccgydF4y2Ba

MFCC提取日志能源、三角洲和δ的音频信号gydF4y2Ba

描述gydF4y2Ba

例子gydF4y2Ba

多项式系数gydF4y2Ba= mfcc (gydF4y2BaaudioIngydF4y2Ba,gydF4y2BafsgydF4y2Ba)gydF4y2Ba返回mel-frequency cepstral系数(MFCCs)音频输入,采样频率gydF4y2BafsgydF4y2Ba赫兹。gydF4y2Ba

例子gydF4y2Ba

多项式系数gydF4y2Ba= mfcc (gydF4y2Ba___gydF4y2Ba,gydF4y2Ba名称=值gydF4y2Ba)gydF4y2Ba使用一个或多个名称参数指定选项。gydF4y2Ba

例子:gydF4y2Ba多项式系数= mfcc (fs, audioIn LogEnergy =“替换”)gydF4y2Ba返回mel-frequency cepstral系数的音频输入信号采样gydF4y2BafsgydF4y2Ba赫兹。第一个系数gydF4y2Ba多项式系数gydF4y2Ba向量替换日志能量值。gydF4y2Ba

例子gydF4y2Ba

(gydF4y2Ba多项式系数gydF4y2Ba,gydF4y2BaδgydF4y2Ba,gydF4y2BadeltaDeltagydF4y2Ba,gydF4y2Ba疯狂的gydF4y2Ba)= mfcc (gydF4y2Ba___gydF4y2Ba)gydF4y2Ba也返回三角洲、δ和样品的位置对应于每个窗口的数据。您可以指定一个输入组合的任何以前的语法。gydF4y2Ba

例子gydF4y2Ba

mfcc (gydF4y2Ba___gydF4y2Ba)gydF4y2Ba没有输出参数块mel-frequency cepstral系数。策划之前,系数是规范化的意思是0和标准偏差1。gydF4y2Ba

  • 如果输入是在时域,系数是与时间绘制。gydF4y2Ba

  • 如果输入是在频域,对帧数的系数是策划。gydF4y2Ba

  • 如果日志提取能量,那么它也绘制。gydF4y2Ba

例子gydF4y2Ba

全部折叠gydF4y2Ba

计算语音信号的mel频率cepstral系数使用gydF4y2BamfccgydF4y2Ba函数。函数返回gydF4y2BaδgydF4y2Ba系数的变化,gydF4y2BadeltaDeltagydF4y2Ba,δ值的变化。的日志能量值函数计算可以预先考虑系数向量或替代系数向量的第一个元素。这样做是基于你是否设置gydF4y2BaLogEnergygydF4y2Ba参数”gydF4y2Ba添加“gydF4y2Ba或“gydF4y2Ba取代“gydF4y2Ba。gydF4y2Ba

读的音频信号gydF4y2BaCounting-16-44p1-mono-15secs.wavgydF4y2Ba文件使用gydF4y2BaaudioreadgydF4y2Ba函数。的gydF4y2BamfccgydF4y2Ba整个演讲过程数据批处理函数。根据输入的行数,窗口长度,和重叠长度,gydF4y2BamfccgydF4y2Ba分区的演讲到1551帧,计算每一帧的cepstral特性。中的每一行gydF4y2Ba多项式系数gydF4y2Ba矩阵对应于log-energy价值其次是13 mel-frequency cepstral系数对应的帧的语音文件。这个函数也计算gydF4y2Ba疯狂的gydF4y2Ba,最后的位置样本在每个输入框。gydF4y2Ba

[audioIn, fs] = audioread (gydF4y2Ba“Counting-16-44p1-mono-15secs.wav”gydF4y2Ba);(多项式系数δ,deltaDelta loc) = mfcc (audioIn fs);gydF4y2Ba

归一化系数。gydF4y2Ba

mfcc (audioIn fs)gydF4y2Ba

图包含一个坐标轴对象。坐标轴对象包含时间(s), ylabel MFCC包含一个类型的对象的形象。gydF4y2Ba

读入一个音频文件,并将它转换成一个频率表示。gydF4y2Ba

[audioIn, fs] = audioread (gydF4y2Ba“彩虹- 16 - 8 mono - 114 - secs.wav”gydF4y2Ba);赢得=损害(1024gydF4y2Ba“周期”gydF4y2Ba);S = stft (audioIngydF4y2Ba“窗口”gydF4y2Ba,赢了,gydF4y2Ba“OverlapLength”gydF4y2Ba,512,gydF4y2Ba“中心”gydF4y2Ba、假);gydF4y2Ba

提取mel-frequency cepstral系数,电话gydF4y2BamfccgydF4y2Ba与频域音频。忽略log-energy。gydF4y2Ba

多项式系数= mfcc(年代,fs,gydF4y2Ba“LogEnergy”gydF4y2Ba,gydF4y2Ba“忽略”gydF4y2Ba);gydF4y2Ba

在许多应用程序中,MFCC观测转换为用于分类汇总统计信息的任务。画一个概率密度函数的mel-frequency cepstral系数来观察其分布。gydF4y2Ba

nbins = 60;coefficientToAnalyze =gydF4y2Ba4gydF4y2Ba;直方图(多项式系数(:,coefficientToAnalyze + 1), nbins,gydF4y2Ba“归一化”gydF4y2Ba,gydF4y2Ba“pdf”gydF4y2Ba)标题(sprintf (gydF4y2Ba“系数% d”gydF4y2Ba,coefficientToAnalyze))gydF4y2Ba

图包含一个坐标轴对象。坐标轴对象与标题系数4包含一个直方图类型的对象。gydF4y2Ba

输入参数gydF4y2Ba

全部折叠gydF4y2Ba

输入信号,指定为一个向量,矩阵,或三维数组。gydF4y2Ba

  • 如果gydF4y2BaaudioIngydF4y2Ba是真实的,它是解释为一个时域信号,必须一个列向量或矩阵。矩阵的列被视为独立的音频通道。gydF4y2Ba

  • 如果gydF4y2BaaudioIngydF4y2Ba是复杂的,它是解释为一个频域的信号。在这种情况下,gydF4y2BaaudioIngydF4y2Ba必须是一个gydF4y2BalgydF4y2Ba——- - - - - -gydF4y2Ba米gydF4y2Ba——- - - - - -gydF4y2BaNgydF4y2Ba数组,gydF4y2BalgydF4y2Ba是DFT点的数量gydF4y2Ba米gydF4y2Ba是个体数量的光谱,gydF4y2BaNgydF4y2Ba是单个通道的数量。gydF4y2Ba

数据类型:gydF4y2Ba单gydF4y2Ba|gydF4y2Ba双gydF4y2Ba
复数的支持:金宝appgydF4y2Ba是的gydF4y2Ba

输入信号的采样率Hz,指定为一个积极的标量。gydF4y2Ba

数据类型:gydF4y2Ba单gydF4y2Ba|gydF4y2Ba双gydF4y2Ba

名称-值参数gydF4y2Ba

指定可选的双参数作为gydF4y2BaName1 = Value1,…,以=家gydF4y2Ba,在那里gydF4y2Ba的名字gydF4y2Ba参数名称和吗gydF4y2Ba价值gydF4y2Ba相应的价值。名称-值参数必须出现在其他参数,但对的顺序无关紧要。gydF4y2Ba

R2021a之前,用逗号来分隔每一个名称和值,并附上gydF4y2Ba的名字gydF4y2Ba在报价。gydF4y2Ba

例子:gydF4y2Ba(多项式系数δ,deltaDelta loc) = mfcc (fs, audioIn LogEnergy =“替换”,DeltaWindowLength = 5)gydF4y2Ba返回梅尔频率cepstral系数的音频输入信号采样gydF4y2BafsgydF4y2Ba赫兹。第一个系数gydF4y2Ba多项式系数gydF4y2Ba向量替换日志能量值。一组5 cepstral系数是用来计算三角洲和δ值。gydF4y2Ba

应用于时域窗口,指定为一个真正的向量。向量中的元素的数量必须在[1,gydF4y2Ba大小(gydF4y2BaaudioIngydF4y2Ba,1)gydF4y2Ba]。向量中的元素的数量也必须大于gydF4y2BaOverlapLengthgydF4y2Ba。gydF4y2Ba

数据类型:gydF4y2Ba单gydF4y2Ba|gydF4y2Ba双gydF4y2Ba

数量的样本之间的重叠相邻窗口,指定为一个整数范围在[0,gydF4y2Ba元素个数(gydF4y2Ba窗口gydF4y2Ba)gydF4y2Ba)。如果未指定的,gydF4y2BaOverlapLengthgydF4y2Ba默认为gydF4y2Ba轮(0.02 *gydF4y2BafsgydF4y2Ba)gydF4y2Ba。gydF4y2Ba

数据类型:gydF4y2Ba单gydF4y2Ba|gydF4y2Ba双gydF4y2Ba

返回的系数数为每个窗口的数据,指定为一个整数的范围[2gydF4y2BavgydF4y2Ba),gydF4y2BavgydF4y2Ba是有效的通频带的数量。gydF4y2Ba

有效的通频带被定义为gydF4y2Ba总和(BandEdges < =地板(fs / 2)) 2gydF4y2Ba。如果它的边缘低于通频带是有效的gydF4y2Bafs / 2gydF4y2Ba,在那里gydF4y2BafsgydF4y2Ba输入音频信号的采样率,指定为第二个参数,gydF4y2BafsgydF4y2Ba。gydF4y2Ba

数据类型:gydF4y2Ba单gydF4y2Ba|gydF4y2Ba双gydF4y2Ba

赫兹带的边缘滤波器银行指定为一个负的单调递增行向量在[0,gydF4y2BafsgydF4y2Ba/ 2)。带边的数量必须在[160]。的gydF4y2BamfccgydF4y2Ba基于功能设计half-overlapped三角过滤器gydF4y2BaBandEdgesgydF4y2Ba。这意味着所有带边缘,除了第一个和最后一个,也是设计带通滤波器的中心频率。gydF4y2Ba

默认情况下,gydF4y2BaBandEdgesgydF4y2Ba42-element向量,结果在40-band过滤器银行,跨度约133赫兹到6864赫兹。默认的乐队和描述的间隔gydF4y2Ba[2]gydF4y2Ba。gydF4y2Ba

数据类型:gydF4y2Ba单gydF4y2Ba|gydF4y2Ba双gydF4y2Ba

数量的垃圾箱用来计算离散傅里叶变换(DFT)的窗口的输入样本。FFT长度必须大于或等于元素的数量gydF4y2Ba窗口gydF4y2Ba。gydF4y2Ba

数据类型:gydF4y2Ba单gydF4y2Ba|gydF4y2Ba双gydF4y2Ba

类型的非线性整流应用离散余弦变换前,指定为gydF4y2Ba“日志”gydF4y2Ba或gydF4y2Ba“立方根”gydF4y2Ba。gydF4y2Ba

数据类型:gydF4y2Ba字符gydF4y2Ba|gydF4y2Ba字符串gydF4y2Ba

用来计算系数δ和δ值,指定为一个奇数大于2。如果未指定的,gydF4y2BaDeltaWindowLengthgydF4y2Ba默认为gydF4y2Ba9gydF4y2Ba。gydF4y2Ba

增量计算使用gydF4y2BaaudioDeltagydF4y2Ba函数。gydF4y2Ba

数据类型:gydF4y2Ba单gydF4y2Ba|gydF4y2Ba双gydF4y2Ba

指定日志如何能量系数向量输出所示,指定为:gydF4y2Ba

  • “添加”gydF4y2Ba——函数加日志能量系数向量。系数向量的长度是1 +gydF4y2BaNumCoeffsgydF4y2Ba。gydF4y2Ba

  • “替换”gydF4y2Ba——函数替换第一个系数的对数能量信号。的长度系数向量gydF4y2BaNumCoeffsgydF4y2Ba。gydF4y2Ba

  • “忽略”gydF4y2Ba——对象不计算或返回日志能量。gydF4y2Ba

数据类型:gydF4y2Ba字符gydF4y2Ba|gydF4y2Ba字符串gydF4y2Ba

输出参数gydF4y2Ba

全部折叠gydF4y2Ba

Mel-frequency cepstral系数,作为一个返回gydF4y2BalgydF4y2Ba——- - - - - -gydF4y2Ba米gydF4y2Ba矩阵或一个gydF4y2BalgydF4y2Ba——- - - - - -gydF4y2Ba米gydF4y2Ba——- - - - - -gydF4y2BaNgydF4y2Ba数组,地点:gydF4y2Ba

  • lgydF4y2Ba——数量的分析窗口分割成音频信号。输入的大小,gydF4y2Ba窗口gydF4y2Ba,gydF4y2BaOverlapLengthgydF4y2Ba控制这个尺寸:gydF4y2BalgydF4y2Ba地板=((大小(gydF4y2BaaudioIngydF4y2Ba1)−元素个数(gydF4y2Ba窗口gydF4y2Ba)))/ (gydF4y2Ba元素个数(窗口)gydF4y2Ba−gydF4y2BaOverlapLengthgydF4y2Ba)+ 1gydF4y2Ba。gydF4y2Ba

  • 米gydF4y2Ba——返回系数每帧的数量。这个值是由gydF4y2BaNumCoeffsgydF4y2Ba和gydF4y2BaLogEnergygydF4y2Ba。gydF4y2Ba

    当gydF4y2BaLogEnergygydF4y2Ba设置为:gydF4y2Ba

    • “添加”gydF4y2Ba——函数加日志能源价值系数向量。系数向量的长度是1 +gydF4y2BaNumCoeffsgydF4y2Ba。gydF4y2Ba

    • “替换”gydF4y2Ba——函数替换第一个系数的对数能量信号。的长度系数向量gydF4y2BaNumCoeffsgydF4y2Ba。gydF4y2Ba

    • “忽略”gydF4y2Ba——函数不计算或返回日志能量。的长度系数向量gydF4y2BaNumCoeffsgydF4y2Ba。gydF4y2Ba

  • NgydF4y2Ba——数量的输入通道(列)。这个值是gydF4y2Ba大小(gydF4y2BaaudioIngydF4y2Ba,2)gydF4y2Ba。gydF4y2Ba

数据类型:gydF4y2Ba单gydF4y2Ba|gydF4y2Ba双gydF4y2Ba

系数的变化从一个帧的数据到另一个,作为一个返回gydF4y2BalgydF4y2Ba——- - - - - -gydF4y2Ba米gydF4y2Ba矩阵或一个gydF4y2BalgydF4y2Ba——- - - - - -gydF4y2Ba米gydF4y2Ba——- - - - - -gydF4y2BaNgydF4y2Ba数组中。的gydF4y2BaδgydF4y2Ba数组是相同的大小和数据类型gydF4y2Ba多项式系数gydF4y2Ba数组中。gydF4y2Ba

数据类型:gydF4y2Ba单gydF4y2Ba|gydF4y2Ba双gydF4y2Ba

的变化gydF4y2BaδgydF4y2Ba值从一个帧的数据到另一个地方,作为一个返回gydF4y2BalgydF4y2Ba——- - - - - -gydF4y2Ba米gydF4y2Ba矩阵或一个gydF4y2BalgydF4y2Ba——- - - - - -gydF4y2Ba米gydF4y2Ba——- - - - - -gydF4y2BaNgydF4y2Ba数组中。的gydF4y2BadeltaDeltagydF4y2Ba数组是相同的大小和数据类型gydF4y2Ba多项式系数gydF4y2Ba和gydF4y2BaδgydF4y2Ba数组。gydF4y2Ba

数据类型:gydF4y2Ba单gydF4y2Ba|gydF4y2Ba双gydF4y2Ba

去年样本在每个分析窗口的位置,作为一个列向量返回的行数一样gydF4y2Ba多项式系数gydF4y2Ba。gydF4y2Ba

数据类型:gydF4y2Ba单gydF4y2Ba|gydF4y2Ba双gydF4y2Ba

算法gydF4y2Ba

全部折叠gydF4y2Ba

MFCCgydF4y2Ba

Mel-frequency倒频谱系数是受欢迎的特性从语音信号中提取用于识别任务。source-filter模型中的言论,cepstral系数是理解代表过滤器(声道)。声道的频率响应是相对顺利,而言论表达的来源可以建模为一个脉冲序列。结果,可以估计声道语音段的谱包络。gydF4y2Ba

的激励理念mel-frequency cepstral系数压缩信息声道(光谱平滑)少量系数基于对耳蜗的理解。虽然没有硬标准计算系数,概述了图的基本步骤。gydF4y2Ba

默认梅尔滤波器组线性空间前10三角过滤器和对数空间剩下的过滤器。gydF4y2Ba

日志能源gydF4y2Ba

中包含的信息第0 mel-frequency cepstral系数通常是增强或取代了日志的能量。日志能量计算取决于输入域。gydF4y2Ba

如果输入(gydF4y2BaaudioIngydF4y2Ba)是一种时域信号,日志能源使用以下公式计算:gydF4y2Ba

日志gydF4y2Ba EgydF4y2Ba =gydF4y2Ba 日志gydF4y2Ba (gydF4y2Ba 总和gydF4y2Ba (gydF4y2Ba xgydF4y2Ba 2gydF4y2Ba )gydF4y2Ba )gydF4y2Ba

如果输入(gydF4y2BaaudioIngydF4y2Ba)是一种频域信号,日志能源使用以下公式计算:gydF4y2Ba

日志gydF4y2Ba EgydF4y2Ba =gydF4y2Ba 日志gydF4y2Ba (gydF4y2Ba 总和gydF4y2Ba (gydF4y2Ba |gydF4y2Ba xgydF4y2Ba |gydF4y2Ba 2gydF4y2Ba )gydF4y2Ba /gydF4y2Ba FgydF4y2Ba FgydF4y2Ba TgydF4y2Ba lgydF4y2Ba egydF4y2Ba ngydF4y2Ba ggydF4y2Ba tgydF4y2Ba hgydF4y2Ba )gydF4y2Ba

引用gydF4y2Ba

[1]拉宾,劳伦斯·R。,罗纳德·w·谢弗。gydF4y2Ba数字语音处理的理论及应用gydF4y2Ba。上台北:皮尔森,2010年。gydF4y2Ba

扩展功能gydF4y2Ba

C / c++代码生成gydF4y2Ba
生成C和c++代码使用MATLAB®编码器™。gydF4y2Ba

GPU的代码生成gydF4y2Ba
生成NVIDIA的CUDA®代码®GPU使用GPU编码器™。gydF4y2Ba

GPU数组gydF4y2Ba
加速代码运行在一个图形处理单元(GPU)使用并行计算工具箱™。gydF4y2Ba

版本历史gydF4y2Ba

介绍了R2018agydF4y2Ba

全部展开gydF4y2Ba