音频工具箱
Entwickeln und Analysieren von Sprach-, Akustik- und Audioverarbeitungssystemen
Die Audio Toolbox™Enthält工具FürIeyoverarbeitung,Die Sprachanalyse und Akustische Messungen。Sie Umfasst AlgorithmenFürIeVerarbeitungvon audiosignalen(Entzerrung und Steuerung dis Dynamikumfangs)undfürakustischemessungen(Schätzungder Impuleartwort,Oktavfilterung und Gewichtung Nach Wahrnehmung)。Außerdembietet sie algorithmenfürdie audio-und sprach-merkmalsextraktion(mfcc undtonhöhe)und Die转换von audiosignalen(伽马托岩堆积und spektraphmm mitmaßeinheitmel)。
Apps in der Toolbox unterstützen Live-Tests für Algorithmen, Messungen von Impulsantworten sowie die Kennzeichnung von Audiosignalen. Die Toolbox bietet Streaming-Schnittstellen für ASIO-, WASAPI-, ALSA- und CoreAudio-Soundkarten und MIDI-Geräte sowie Tools zum Generieren und Hosten standardmäßiger Audio-Plugins wie VST und Audio Units.
Mit der Audio Toolbox können Sie Audiodatensätze importieren, kennzeichnen und erweitern sowie für Machine Learning und Deep Learning Merkmale extrahieren und Signale transformieren. Sie können in Echtzeit an Prototypen von Audioverarbeitungsalgorithmen arbeiten, indem Sie Audiodaten mit kurzen Latenzzeiten streamen und dabei Parameter optimieren und Signale visualisieren. Außerdem können Sie Ihren Algorithmus validieren, indem Sie ihn in ein Audio-Plugin umwandeln, das in externen Host-Anwendungen wie Digital Audio Workstations ausgeführt werden kann. Mithilfe des Plugin-Hosting können Sie externe Audio-Plugins wie reguläre Objekte verwenden, um MATLAB®-Arrays zu verarbeiten. Mithilfe von Soundkartenverbindungen können Sie benutzerdefinierte Messungen für reale Audiosignale und Akustiksysteme durchführen.
Jetzt beginnen:
verbindungen mitstandardmäßigenandiotreibern
Lesen und schreiben Sie Audiodaten von oder auf Soundkarten (etwa über USB oder Thunderbolt™) mithilfe standardmäßiger Audiotreiber (gemäß ASIO, WASAPI, CoreAudio und ALSA) auf Windows®-, Mac®- und Linux®-Betriebssystemen.
Mehrkanal-Audio Streaming Mit Kurzen Latenzzeiten
Verarbeiten Sie Live-Audio in MATLAB mit Round-Trip-Latenzzeiten im Millisekundenbereich.
Vortrainierte Deep-Learning-Modelle
Verwenden Sie häufig verwendete Deep-Learning-Modelle, die mit großen Audiodatensätzen vortrainiert sind, um komplexe Audioverarbeitungsaufgaben durchzuführen - klassifizieren Sie Klangereignisse in Audioaufnahmen mit Yamnet und extrahieren Sie Audioeinbettungen mit VGGish.
Audio-und Sprach-Merkmalsextraktion
Extrahieren Sie低级特点FürSprach-undaiveanalysen,Einschließlich梅尔频率跳跃系数(MFCC),γ肌肉系数(GTCC),Tonhöhe,Harmonik und Spektrale DeskRiptoren。ÜbergebenSIEDYN一个深入学习architekturen,Die AneTreihen Arbeiten,Wie Beispielsweise Diejenigen,Die AUF LSTM-Ebenen Basieren。
Zeit-Frequenz-Transformationen
Transformieren Sie Signale in Zeit-Frequenz-Darstellung, indem Sie eine modifizierte diskrete Kosinustransformation (MDCT), eine Kurzzeit-Fourier-Transformation (STFT) oder das kompaktere Spektrogramm mit der Maßeinheit Mel nutzen. Zerlegen Sie Signale mithilfe wahrnehmungsbasierter Frequenzbänder, die Gammatone-Filterbänke verwenden. Übergeben Sie Daten an Deep-Learning-Modelle, die an zweidimensionalen Daten arbeiten, wie beispielsweise diejenigen, die auf CNN-Ebenen basieren.
Beschriften und Kommentieren Sieaudiodatensätze
Weisen Sie Audioaufnahmen und Datensätzen manuell und automatisch Ground-Truth-Labels und -Kommentare zu. Erkennen von Sprachregionen in Audiosignalen. Automatisieren Sie die Sprachtranskription mit cloudbasierten Services, die Sprache in Text umwandeln.
EinlesenGroßer音频 - Datensätze
Indizieren und lesen Sie große Mengen an Audioaufnahmen mitaudiodatastore.
。Teilen Sie听von audiodateienwillkürlichanhandvon kennzennungen auf。Parallelisieren Sie Verarbeitungsaufgaben Mithilfe von Tall-inraysFürdirenerweiterungen,Zeit-yaterenz-Transformenen und Merkmalsextraktion。
Erweitern und synthetisieren Sie Audio- und Sprachdatensätze
Richten Sie Orconisierte管道ZurDatenverstärkungEin,Indem Sie Kombinationen AusTonhöhenverschiebung,Zeitdehnung und Anderen Audioverarbeitungseffekten Verwenden。Estheren Sie Synthetische Sprachaufzeichnungen Aus文本MIT HILFE von云-Basierten Text-Zu-Sprache-Diensten。
Audiofilter und Equalizer
Modellieren Sie parametrische EQ-Filter, grafische EQ-Filter, Shelving-Filter und Filter mit variabler Flankensteilheit und wenden Sie diese an. Entwickeln und simulieren Sie digitale Frequenzweichen, Oktaven- und Teiloktavenfilter.
Steuerung des Dynamikumfangs und Effekte
Modellieren Sie Algorithmen für die Dynamikbearbeitung, wie Compressor, Limiter, Expander und Noise-Gate und wenden Sie diese an. Fügen Sie mit rekursiven parametrischen Modellen einen künstlichen Nachhall hinzu.
Systemsimulation MIT BlockDiagromen
Entwickeln und simulieren Sie Systemmodelle mit Bibliotheken von Audio-Verarbeitungsblöcken für Simulink®。Optimieren Sie Parameter und visualisieren Sie das Systemverhalten mithilfe interaktiver Steuerelemente und dynamischer Diagramme.
Live-ParametyOptimierungüberbenutzerboblächen
Automatische Erstellung von Benutzeroberflächen für optimierbare Parameter von Audioverarbeitungsalgorithmen. Testen Sie einzelne Algorithmen mit der Audio Test Bench-App und optimieren Sie Parameter in laufenden Programmen mit automatisch generierten interaktiven Steuerelementen.
MIDI-Konnektivität für die Parametersteuerung und den Nachrichtenaustausch
Ändern Sie interaktiv Parameter von MATLAB-Algorithmen mithilfe von MIDI-Steuerungsoberflächen. Steuern Sie externe Hardware, oder reagieren Sie auf Ereignisse, indem Sie MIDI-Nachrichten jeder Art senden und empfangen.
Auf Standards basierende Messungen und Analysen
Wenden Sie Schalldruckpegel (SPL)- und Lautstärkemessungen auf aufgenommene Signale oder direkt übertragene Signale an. Analysieren Sie Signale mit Oktaven- und Teiloktavenfiltern. Wenden Sie standardkonforme A-, C- oder K-Bewertungsfilter auf Rohaufnahmen an.
Messung von Impulsantworten
Messen Sie Impulsantworten und Frequenzgänge von Akustik- und Audiosystemen mit Maximalfolgen (Maximum-Length Sequences, MLS) und exponentiell geschwungenen Sinusoiden (ESS). Beginnen Sie mit der Impulse Response Measurer-App. Automatisieren Sie Messungen, indem Sie Anregungssignale programmatisch generieren und Systemreaktionen schätzen.
麻省理工学院Raumimpulsantworten Effiziente褶积
Falten Sie Signale mit langen Impulsantworten effizient, indem Sie Overlap-and-Add- oder Overlap-and-Save-Implementierungen für den Frequenzbereich nutzen. Finden Sie Kompromisse zwischen Latenzzeiten und Berechnungsgeschwindigkeit mithilfe einer automatischen Impulsantwort-Partitionierung.
Räumliches音频
Codieren und decodieren Sie unterschiedliche Ambisonic-Formate. Interpolieren Sie räumlich abgetastete Außenohrübertragungsfunktionen (Head-Related Transfer Functions, HRTF).
Generierung von Audio-Plugins
Generieren Sie VST-Plug-ins, AU-Plug-ins und eigenständige ausführbare Plug-ins direkt aus MATLAB-Code, ohne dass eine manuelle Gestaltung von Benutzeroberflächen erforderlich ist. Für fortgeschritteneres Plugin-Prototyping generieren Sie fertige JUCE C++ Projekte (erfordert MATLAB Coder™).
举办externer Audio-Plugins
Verwenden Sie externe VST- und AU-Plugins als reguläre MATLAB-Objekte. Ändern Sie Plugin-Parameter und verarbeiten Sie MATLAB-Arrays programmatisch. Automatisieren Sie alternativ Zuordnungen von Plugin-Parametern zu Benutzeroberflächen und MIDI-Steuerelementen. Hosten Sie aus Ihrem MATLAB-Code generierte Plugins, um die Effizienz der Ausführung zu erhöhen.
Kostengünstige und mobile Geräte
Erstellen您Prototypen毛皮Audioverarbeitungsdesigns auf Raspberry Pi™ mithilfe platineneigener oder externer Mehrkanal-Audioschnittstellen. Erstellen Sie interaktive Steuerbereiche als mobile Apps für Android®- oder iOS-Geräte.
Systeme ohne Latenz
Erstellen您Prototypen毛皮Audioverarbeitungsdesigns mit Ein- und Ausgaben aus einer einzigen Abtastung für die adaptive Rauschunterdrückung, die Validierung von Hörgeräten oder andere Anwendungen, für die die Round-Trip-DSP-Latenzzeiten minimal sein müssen. Automatische Übertragung direkt aus Simulink Modellen auf Speedgoat Audiohardware und ST Discovery Platinen.
YAMNet Sound-Klasseneinteilung
Klasseneinteilung von Tonaufnahmen mit Hilfe von Deep Learning (Deep Learning Toolbox erforderlich)
VGGish-Audio-Einbettungen
Extrahieren von Audio-Features auf höchstem Niveau mit Hilfe von Deep Learning (Deep Learning Toolbox erforderlich)
Verallgemeinerte Cepstral-Koeffizienten und Delta Features
Berechnung von MFCC, GTCC, BFCC und anderen Arten von Cepstral-Koeffizienten, auditorischen Spektrogrammen und Delta Features
Oktavanalyse für unhörbare Frequenzen
Analyse von Signalen mit verbesserten Oktavfilter-Designs unter Verwendung von octaveFilter, octaveFilterBank und splMeter
Akustische Fluktuation
Messung der wahrgenommenen akustischen Fluktuation
GPU-BESCHLEUNIGUNGFÜRIEMERKMALSEXTRAKTION
Beschleunigen Sie zusätzliche Funktionen für die Merkmalsextraktion mit kompatiblen GPU-Karten (Parallel Computing Toolbox erforderlich)
详细信息zu柴油Funktionsmerkmalen und denzugehörigenfunktionen findend sieRelease Notes。