音频工具箱

设计和分析语音,声学和音频处理系统

Audio Toolbox™提供音频处理、语音分析和声学测量工具。它包括音频信号处理(如均衡和动态范围控制)和声学测量(如脉冲响应估计、倍频滤波和感知加权)的算法。它还提供了音频和语音特征提取(如MFCC和基音)和音频信号转换(如伽玛通滤波器组和梅尔间隔谱图)的算法。

工具箱应用程序支持实时算法金宝app测试、脉冲响应测量和音频信号标记。工具箱提供了ASIO、WASAPI、ALSA和CoreAudio声卡和MIDI设备的流接口,以及用于生成和托管标准音频插件(如VST和audio Units)的工具。

通过Audio Toolbox,您可以导入、标签和增强音频数据集,以及提取特征和转换信号,用于机器学习和深度学习。您可以通过流式低延迟音频实时原型音频处理算法,同时调整参数和可视化信号。你也可以验证你的算法,把它变成一个音频插件运行在外部主机应用程序,如数字音频工作站。插件托管让您使用外部音频插件,如常规对象处理MATLAB®数组。声卡连接使您能够在真实的音频信号和声学系统上运行自定义测量。

开始:

音频流与声卡

连接到标准的笔记本电脑和桌面声卡,在任何文件组合和实时输入输出之间流低延迟多通道音频。

连接到标准音频驱动程序

使用标准音频驱动程序(如ASIO, WASAPI, CoreAudio和ALSA)跨Windows从声卡(如USB或Thunderbolt™)读写音频样本®、Mac®和Linux®操作系统。

多声道声卡。

低延迟多通道音频流

处理实时音频在MATLAB与毫秒的往返延迟。

现场原始输入四通道麦克风阵列。

机器学习和深度学习

标签,增加,创建和摄取音频和语音数据集,提取特征,并计算时频转换。使用统计学和机器学习工具箱™,深度学习工具箱™,或其他机器学习工具开发音频和语音分析。

预先训练的深度学习模型

使用经过大型音频数据集预训练的流行深度学习模型来执行复杂的音频处理任务——使用Yamnet对音频记录中的声音事件进行分类,并使用VGGish提取音频嵌入。

字云显示识别的声音类型classifySound在一个特定的音频片段。

音频和语音特征提取

为语音和音频分析提取低级特征,包括梅尔频率倒谱系数(MFCC),伽玛通倒谱系数(GTCC),音调,和声和谱描述符。为工作在时间序列上的深度学习架构提供支持,例如基于LSTM层的架构。

在实时编辑器中使用音频特性提取器时交互式地选择感兴趣的缓冲选项和特性。

时频转换

使用改进的离散余弦变换(MDCT)、短时傅里叶变换(STFT)或更紧凑的梅尔间隔谱图将信号转换为时频表示。通过使用伽马通滤波器组的感知间隔频带分解信号。向深度学习模型提供二维数据,比如那些基于CNN层的数据。

Live Mel语音指令的声谱图。

标签和注释音频数据集

手动和自动地为音频记录和数据集分配地面真相标签和注释。检测音频信号中的语音区域。使用基于语音到文本的云服务自动语音转录。

在音频标签应用程序感兴趣的区域标签。

摄取大型音频数据集

使用索引和从大型音频录音集合读取audioDatastore.根据标签随机分割音频文件列表。使用高数组并行化处理任务,用于数据增强、时频转换和特征提取。

指向谷歌语音命令数据集的数据存储。

增强和合成音频和语音数据集

建立随机的数据增强管道使用组合的音高移动,时间拉伸,和其他音频处理效果。使用基于文本到语音的云服务从文本创建合成语音录音。

音色不变音调移动的共振峰估计。

音频处理算法和效果

生成标准波形,应用常见音频效果,设计带有动态参数调优和实时可视化的音频处理系统。

音频过滤器和均衡器

模型和应用参数EQ,图形EQ,搁置,和可变斜率滤波器。设计和模拟数字交叉,倍频,和分数倍频滤波器。

交互式调谐的三频带交叉滤波器与现场可视化。

动态范围控制和效果

建模并应用动态范围处理算法,如压缩机、限幅器、扩展器和噪声门。加入人工混响递归参数模型。

压缩机动态响应的交互调整。

系统仿真与框图

使用Simulink中的音频处理模块库设计和仿真系统模型金宝app®.使用交互控制和动态图调整参数和可视化系统行为。

详细介绍了在Simulink中的多频带动态范围压缩机模型。金宝app

实时音频的原型

在MATLAB中通过交互式实时听力测试验证音频处理算法。

通过用户界面实时参数调优

自动创建用户界面的可调参数的音频处理算法。使用Audio Test Bench应用程序测试单个算法,并使用自动生成的交互控件在运行程序中调整参数。

交互式调谐的一个自定义三频带参数EQ使用音频测试台。

用于参数控制和消息交换的MIDI连接

利用MIDI控制曲面交互改变MATLAB算法的参数。通过发送和接收任何类型的MIDI消息来控制外部硬件或响应事件。

用MATLAB编写的用于乐器合成器的MIDI消息和音频信号流。

声学测量和空间音频

测量系统响应,分析和测量信号,并设计空间音频处理系统。

基于标准的计量和分析

应用声压级(SPL)计和响度计记录或现场信号。用八度和分数八度滤波器分析信号。对原始记录应用符合标准的A-、C-或k -加权过滤器。

2 / 3倍频带不同声压级测量的可视化。

脉冲响应测量

用最大长度序列(MLS)和指数扫描正弦波(ESS)测量声学和音频系统的脉冲和频率响应。开始使用脉冲响应测量应用程序。通过编程生成激励信号和估计系统响应,实现自动化测量。

脉冲响应测量程序。

有效卷积与房间脉冲响应

使用频域重叠加或重叠保存实现有效地卷积具有长脉冲响应的信号。使用自动脉冲响应分区来权衡延迟和计算速度。

脉冲响应持续5秒或超过220k样本在44100Hz。

空间音频

编码和解码不同的两栖格式。插值空间采样的头部相关传递函数(HRTF)。

期望的声源位置和HRTF测量可用的最近角度的例子。

生成和宿主音频插件

用MATLAB编写的原型音频处理算法,作为标准音频插件;使用外部音频插件作为常规MATLAB对象。

生成音频插件

生成VST插件,AU插件,和独立的可执行插件直接从MATLAB代码,不需要手动设计用户界面。对于更高级的插件原型,生成现成的JUCE c++项目(需要MATLAB Coder™)。

多波段参数EQ示例:VST插件由MATLAB代码生成并在REAPER中运行。

托管外部音频插件

使用外部VST和AU插件作为常规MATLAB对象。改变插件参数和编程处理MATLAB数组。或者,自动化插件参数与用户界面和MIDI控件的关联。由MATLAB代码生成的宿主插件,以提高执行效率。

用于音频去噪的外部VST插件示例(Accusonus ERA-N)和MATLAB中的编程接口。

目标:嵌入式和实时音频系统

使用附加c代码生成产品在软件设备上实现音频处理设计,并自动下载188bet金宝搏连接到多通道音频接口。

低成本和移动设备

通过使用板载或外部多通道音频接口,Raspberry Pi™上的原型音频处理设计。创建交互式控制面板作为Android的移动应用程序®或iOS设备。

树莓派3板。

实现零延迟的系统

具有单样本输入和输出的原型音频处理设计,用于自适应噪声控制、助听器验证或其他需要最小往返DSP延迟的应用程序。自动目标Speedgoat音频机和ST发现板直接从Simulink模型。金宝app

最新的特性

YAMNet声音分类

使用深度学习对录音进行分类(需要深度学习工具箱)

VGGish音频嵌入

使用深度学习提取高级音频特征(需要深度学习工具箱)

广义倒谱系数和Delta特征

计算MFCC, GTCC, BFCC和其他类型的倒谱系数,听觉谱图,和delta特征

听不见的频率的八度分析

使用octaveFilter, octaveFilterBank和splMeter分析增强的倍频滤波器设计信号

声学波动

测量感知的声起伏

GPU加速特征提取

使用兼容的GPU卡加速特征提取的附加功能(需要并行计算工具箱)

看到发布说明有关这些特性和相应功能的详细信息。