音频工具箱
设计和分析语音,声学和音频处理系统
Audio Toolbox™提供音频处理、语音分析和声学测量工具。它包括处理音频信号(如均衡和时间延伸)的算法,估计音频信号度量(如响度和清晰度),以及提取音频特征(如MFCC和音调)的算法。它还提供先进的机器学习模型,包括i-向量,和预先训练的深度学习网络,包括VGGish和CREPE。工具箱应用程序支持实时算法金宝app测试、脉冲响应测量和信号标记。工具箱提供了ASIO、CoreAudio和其他声卡的流接口;MIDI设备;以及用于生成和托管VST和音频单元插件的工具。
通过Audio Toolbox,您可以导入、标签和增强音频数据集,以及提取特征来训练机器学习和深度学习模型。所提供的预训练模型可用于音频记录的高级语义分析。
您可以实时原型音频处理算法,或通过将低延迟音频传输到声卡来运行定制声学测量。您可以通过将其转换为音频插件来验证您的算法,以在外部主机应用程序(如数字音频工作站)中运行。插件托管让您使用外部音频插件作为常规MATLAB®物体。
开始:
连接到标准音频驱动程序
从声卡(如USB或Thunderbolt)读取和写入音频样本™) 跨Windows使用标准音频驱动程序(如ASIO、WASAPI、CoreAudio和ALSA)®、Mac®和Linux®操作系统。
预先训练的深度学习模型
使用深度学习进行复杂的信号处理任务,并用单行代码提取音频嵌入式。访问建立的预先培训的网络,如yamnet,Vggnish,Crepe和OpenL3,并在预配置的特征提取功能的帮助下应用它们。
音频,语音和声学的功能提取
将信号转换为时频表示,如Mel、树皮和ERB频谱图。计算倒谱系数,如MFCC和GTCC,以及标量特征,如音调、和谐度和频谱描述符。使用预先训练的深度学习模型(VGGish、OpenL3)提取高级特征和信号嵌入和i-vector系统。使用兼容的GPU卡加速特征提取。
机器学习模型和训练食谱
使用音频数据集训练最先进的机器学习。将已建立的模型系统(如i-vectors)用于说话人识别和验证等应用。通过工作示例学习如何设计和训练高级神经网络和音频、语音和声学应用层。
导入、注释和预处理音频数据集
读取、分割和预处理大量录音集。使用应用程序手动注释音频信号。使用预先训练的机器学习模型自动识别和分割感兴趣的区域。
增强和合成音频和语音数据集
建立随机的数据增强管道使用组合的音高移动,时间拉伸,和其他音频处理效果。使用基于文本到语音的云服务从文本创建合成语音录音。
用于参数控制和消息交换的MIDI连接
使用MIDI控制面交互更改MATLAB算法的参数。通过发送和接收任何类型的MIDI消息来控制外部硬件或响应事件。
基于标准的计量和分析
应用声压级(SPL)计和响度计记录或现场信号。用八度和分数八度滤波器分析信号。对原始记录应用符合标准的A-、C-或k -加权过滤器。测量声锐度、粗糙度和波动强度。
脉冲响应测量
用最大长度序列(MLS)和指数扫描正弦波(ESS)测量声学和音频系统的脉冲和频率响应。开始使用脉冲响应测量应用程序。通过编程生成激励信号和估计系统响应,实现自动化测量。
生成音频插件
生成VST插件,AU插件,和独立的可执行插件直接从MATLAB代码,不需要手动设计用户界面。对于更高级的插件原型,生成现成的JUCE c++项目(需要MATLAB Coder™)。
托管外部音频插件
使用外部VST和AU插件作为常规MATLAB对象。改变插件参数和编程处理MATLAB数组。或者,自动化插件参数与用户界面和MIDI控件的关联。由MATLAB代码生成的宿主插件,以提高执行效率。
CPU和GPU目标的代码生成
与MathWorks合作®编码器产品,下载188bet金宝搏生成C和c++源代码从信号处理和机器学习算法提供的工具箱函数,对象,和块。生成CUDA的源代码从选择特征提取函数mfcc
和melSpectrogram
.
低成本和移动设备
通过使用板载或外部多通道音频接口,Raspberry Pi™上的原型音频处理设计。创建交互式控制面板作为Android的移动应用程序®或iOS设备。
实现零延迟的系统
原型音频处理设计,具有单样本输入和输出,用于自适应噪声控制、助听器验证或其他需要最小往返DSP延迟的应用。直接从Simulink模型自动瞄准Speedgoat音频机器和ST Discovery板。金宝app