音频工具箱

Entwickeln und Analysieren von Sprach-, Akustik- und Audioverarbeitungssystemen

Video ansehen

Die Audio Toolbox™Enthält工具FürIeyoverarbeitung，Die Sprachanalyse und Akustische Messungen。Sie Umfasst AlgorithmenFürIeVerarbeitungvon audiosignalen（Entzerrung und Steuerung dis Dynamikumfangs）undfürakustischemessungen（Schätzungder Impuleartwort，Oktavfilterung und Gewichtung Nach Wahrnehmung）。Außerdembietet sie algorithmenfürdie audio-und sprach-merkmalsextraktion（mfcc undtonhöhe）und Die转换von audiosignalen（伽马托岩堆积und spektraphmm mitmaßeinheitmel）。

Apps in der Toolbox unterstützen Live-Tests für Algorithmen, Messungen von Impulsantworten sowie die Kennzeichnung von Audiosignalen. Die Toolbox bietet Streaming-Schnittstellen für ASIO-, WASAPI-, ALSA- und CoreAudio-Soundkarten und MIDI-Geräte sowie Tools zum Generieren und Hosten standardmäßiger Audio-Plugins wie VST und Audio Units.

Mit der Audio Toolbox können Sie Audiodatensätze importieren, kennzeichnen und erweitern sowie für Machine Learning und Deep Learning Merkmale extrahieren und Signale transformieren. Sie können in Echtzeit an Prototypen von Audioverarbeitungsalgorithmen arbeiten, indem Sie Audiodaten mit kurzen Latenzzeiten streamen und dabei Parameter optimieren und Signale visualisieren. Außerdem können Sie Ihren Algorithmus validieren, indem Sie ihn in ein Audio-Plugin umwandeln, das in externen Host-Anwendungen wie Digital Audio Workstations ausgeführt werden kann. Mithilfe des Plugin-Hosting können Sie externe Audio-Plugins wie reguläre Objekte verwenden, um MATLAB^®-Arrays zu verarbeiten. Mithilfe von Soundkartenverbindungen können Sie benutzerdefinierte Messungen für reale Audiosignale und Akustiksysteme durchführen.

Jetzt beginnen:

音频流MIT Soundkarten

Stellen Sie Verbindungen mit standardmäßigen Laptop- und Desktop-Soundkarten her, um Mehrkanal-Audio mit kurzen Latenzzeiten zwischen beliebigen Kombinationen von Dateien und Live-Eingaben/-Ausgaben zu streamen.

verbindungen mitstandardmäßigenandiotreibern

Lesen und schreiben Sie Audiodaten von oder auf Soundkarten (etwa über USB oder Thunderbolt™) mithilfe standardmäßiger Audiotreiber (gemäß ASIO, WASAPI, CoreAudio und ALSA) auf Windows^®-, Mac^®- und Linux^®-Betriebssystemen.

Audiounterstützung von der Audio Toolbox

Echtzeit-Audio in MATLAB

Mehrkanal-Soundkarten.

Mehrkanal-Audio Streaming Mit Kurzen Latenzzeiten

Verarbeiten Sie Live-Audio in MATLAB mit Round-Trip-Latenzzeiten im Millisekundenbereich.

Audio-E / A：Bufferung，Latenzzeiten und Durchsatz

Messen von Audio-Latenzzeiten

Leistungsmessungen für das Streaming von Echtzeit-Audio-Algorithmen

Live-Roheingabedaten von einem Vierkanal-Mikrofon-Array.

机器学习und深度学习

SieKönnenAudio-undSprachdatensätzeKennzeichnen，Erweitern，Ertersellen undeinlesen，Merkmale Extrahieren Sowie Zeit-yearenz-Transformenen Berechnen。Entwickeln SieAußerdemAudio-und Sprachanalysen Mit Der统计和机器学习工具箱™，DER DEAGE学习工具箱™oder Anderen机器学习工具。

Vortrainierte Deep-Learning-Modelle

Verwenden Sie häufig verwendete Deep-Learning-Modelle, die mit großen Audiodatensätzen vortrainiert sind, um komplexe Audioverarbeitungsaufgaben durchzuführen - klassifizieren Sie Klangereignisse in Audioaufnahmen mit Yamnet und extrahieren Sie Audioeinbettungen mit VGGish.

classifysound.

vggishFeatures

yamnet

vggish

Wortwolke，Welche Die Vonclassifysound.identifizierten Tontypen in einem bestimmten Audiosegment anzeigt.

Audio-und Sprach-Merkmalsextraktion

Extrahieren Sie低级特点FürSprach-undaiveanalysen，Einschließlich梅尔频率跳跃系数（MFCC），γ肌肉系数（GTCC），Tonhöhe，Harmonik und Spektrale DeskRiptoren。ÜbergebenSIEDYN一个深入学习architekturen，Die AneTreihen Arbeiten，Wie Beispielsweise Diejenigen，Die AUF LSTM-Ebenen Basieren。

Identifikation von Sprechhern Anhand vonTonhöheund MFCC

Klassifikation nach Geschlecht mit LSTM-Netzen (Long Short-Term Memory)

Sprachaktivitätserkennung在Rauschen Mithilfe von深深学习

ExtraktorFürautiofunktionen.

Interaktive Auswahl von Pufferungsoptionen und Funktionen von Interesse unter Verwendung des Extraktors für Audiofunktionen im Live Editor.

Zeit-Frequenz-Transformationen

Transformieren Sie Signale in Zeit-Frequenz-Darstellung, indem Sie eine modifizierte diskrete Kosinustransformation (MDCT), eine Kurzzeit-Fourier-Transformation (STFT) oder das kompaktere Spektrogramm mit der Maßeinheit Mel nutzen. Zerlegen Sie Signale mithilfe wahrnehmungsbasierter Frequenzbänder, die Gammatone-Filterbänke verwenden. Übergeben Sie Daten an Deep-Learning-Modelle, die an zweidimensionalen Daten arbeiten, wie beispielsweise diejenigen, die auf CNN-Ebenen basieren.

Rauschentfernung Bei Spit Mit Deep-Learning-Netzwerken

Trennung von Sprechern auf einer Cocktailparty mit Deep-Learning-Netzwerken

Erkennung von Sprachbefehlen mit Deep Learning

Live-Mel-Spektrogramm von Sprachbefehlen.

Beschriften und Kommentieren Sieaudiodatensätze

Weisen Sie Audioaufnahmen und Datensätzen manuell und automatisch Ground-Truth-Labels und -Kommentare zu. Erkennen von Sprachregionen in Audiosignalen. Automatisieren Sie die Sprachtranskription mit cloudbasierten Services, die Sprache in Text umwandeln.

Kennzeichnen von Audio mit Audio Labeler

Transkription von Sprache in Text

Wellenform-Segmentierung mit Deep Learning

Sprache automatisch mit dem Audio Labeler kommentieren

Kennzeichnungen für Bereiche von Interesse in der Audio Labeler-App.

EinlesenGroßer音频 - Datensätze

Indizieren und lesen Sie große Mengen an Audioaufnahmen mitaudiodatastore.。Teilen Sie听von audiodateienwillkürlichanhandvon kennzennungen auf。Parallelisieren Sie Verarbeitungsaufgaben Mithilfe von Tall-inraysFürdirenerweiterungen，Zeit-yaterenz-Transformenen und Merkmalsextraktion。

Informationen zu audioDatastore

Schlagwort-Spotting在Rauschen通过MFCC-und LSTM-Netzwerken

Sprecherverifizierung Mit I-Vektoren

Datastore，Der Auf Den Datensatz der Google-Sprachbefehle Verweist。

Erweitern und synthetisieren Sie Audio- und Sprachdatensätze

Richten Sie Orconisierte管道ZurDatenverstärkungEin，Indem Sie Kombinationen AusTonhöhenverschiebung，Zeitdehnung und Anderen Audioverarbeitungseffekten Verwenden。Estheren Sie Synthetische Sprachaufzeichnungen Aus文本MIT HILFE von云-Basierten Text-Zu-Sprache-Diensten。

Text-zu-Sprache-Synthese

Audiodaten-Verstärker

Tonhöheninvariante Zeitdehnung

Tonhöhenverschiebung

Formantenschätzung für klangfarbeninvariante Tonhöhenverschiebung.

Audioverarbeitungsalgorithmen和-effekte

Generieren Sie Standard-Wellenformen, wenden Sie allgemeine Audioeffekte an und entwickeln Sie Audioverarbeitungssysteme mit dynamischer Parameteroptimierung und Live-Visualisierung.

Audiofilter und Equalizer

Modellieren Sie parametrische EQ-Filter, grafische EQ-Filter, Shelving-Filter und Filter mit variabler Flankensteilheit und wenden Sie diese an. Entwickeln und simulieren Sie digitale Frequenzweichen, Oktaven- und Teiloktavenfilter.

Parametrische Entzerrung.

Grafische Entzerrung

Entwicklung eines Parametrischen Equalizers

Interaktive Optimierung einer Dreiband-Frequenzweiche mit Live-Visualisierung.

Steuerung des Dynamikumfangs und Effekte

Modellieren Sie Algorithmen für die Dynamikbearbeitung, wie Compressor, Limiter, Expander und Noise-Gate und wenden Sie diese an. Fügen Sie mit rekursiven parametrischen Modellen einen künstlichen Nachhall hinzu.

Steuerung des Dynamikumfangs

Multiband-Kompression des Dynamikumfangs

Interaktive Optimierung der Dynamischen Reaktion Eines压缩机算法。

Systemsimulation MIT BlockDiagromen

Entwickeln und simulieren Sie Systemmodelle mit Bibliotheken von Audio-Verarbeitungsblöcken für Simulink^®。Optimieren Sie Parameter und visualisieren Sie das Systemverhalten mithilfe interaktiver Steuerelemente und dynamischer Diagramme.

Echtzeit-Audio in Simulink

Multiband-Kompression des Dynamikumfangs

Detail eines Multiband-Kompressionsmodells mit dynamischem Bereich in Simulink.

Echtzeit-Audio-Prototyping

Valieren Sie Audioverarbeitungsalgorithen Mit Interaktenive Echtzeit-Hörtests在Matlab。

Live-ParametyOptimierungüberbenutzerboblächen

Automatische Erstellung von Benutzeroberflächen für optimierbare Parameter von Audioverarbeitungsalgorithmen. Testen Sie einzelne Algorithmen mit der Audio Test Bench-App und optimieren Sie Parameter in laufenden Programmen mit automatisch generierten interaktiven Steuerelementen.

Vorstellung der Audio Test Bench

Echtzeit-Parameteroptimierung

Verzögerungsbasierte Audioeffekte

Interaktive Optimierung eines benutzerdefinierten parametrischen Dreiband-EQ-Filters mit Audio Test Bench.

MIDI-Konnektivität für die Parametersteuerung und den Nachrichtenaustausch

Ändern Sie interaktiv Parameter von MATLAB-Algorithmen mithilfe von MIDI-Steuerungsoberflächen. Steuern Sie externe Hardware, oder reagieren Sie auf Ereignisse, indem Sie MIDI-Nachrichten jeder Art senden und empfangen.

是Sind Daws，Audio-Plugins und Midi-Controller？

MIDI-Geräteschnittstelle

MIDI-SteuerungFÜRAudio-Plugins

Verwendung einer MIDI-Controller-Oberfläche zur Interaktion mit einem Simulink-Modell

In MATLAB geschriebener MIDI-Nachrichten- und Audiosignal-Fluss für einen Musikinstrument-Synthesizer.

Akustische Messungen und Raumklang

Messen Sie Systemreaktionen, analysieren und messen Sie Signale. Entwickeln Sie dazu Systeme für die räumliche Audioverarbeitung.

Auf Standards basierende Messungen und Analysen

Wenden Sie Schalldruckpegel (SPL)- und Lautstärkemessungen auf aufgenommene Signale oder direkt übertragene Signale an. Analysieren Sie Signale mit Oktaven- und Teiloktavenfiltern. Wenden Sie standardkonforme A-, C- oder K-Bewertungsfilter auf Rohaufnahmen an.

Lautstärkenormalisierungemäßdem标准EBU R 128

Schalldruckmessung von Oktaven-Frequenzbändern

THD + NMESSUNG MIT音调跟踪

Binaurale Audiowiedergabe mit Head-Tracking

Visualisierung unterschiedlicher SPL-Messungen über Zweidrittel-Oktav-Bänder.

Messung von Impulsantworten

Messen Sie Impulsantworten und Frequenzgänge von Akustik- und Audiosystemen mit Maximalfolgen (Maximum-Length Sequences, MLS) und exponentiell geschwungenen Sinusoiden (ESS). Beginnen Sie mit der Impulse Response Measurer-App. Automatisieren Sie Messungen, indem Sie Anregungssignale programmatisch generieren und Systemreaktionen schätzen.

Vorstellung von Impulse Response Measurer

Messen des Frequenzgangs eines Audiogeräts

脉冲响应测量器 - 应用程序。

麻省理工学院Raumimpulsantworten Effiziente褶积

Falten Sie Signale mit langen Impulsantworten effizient, indem Sie Overlap-and-Add- oder Overlap-and-Save-Implementierungen für den Frequenzbereich nutzen. Finden Sie Kompromisse zwischen Latenzzeiten und Berechnungsgeschwindigkeit mithilfe einer automatischen Impulsantwort-Partitionierung.

Messen der Impulsantwort eines Audiosystems

信息ZUM频率频率释放伯雷派 - FIR滤波器MIT Partitionierung

Impulsantwort von 5 Sekunden oder mehr – 220.000 Abtastwerte bei 44100 Hz.

Räumliches音频

Codieren und decodieren Sie unterschiedliche Ambisonic-Formate. Interpolieren Sie räumlich abgetastete Außenohrübertragungsfunktionen (Head-Related Transfer Functions, HRTF).

Binaurale Ambisonic-Decodierung

Generierung von Ambisonic-Plugins

Beispiel für die gewünschte Schallquellenposition und nächstgelegene Winkel, aus denen HRTF-Messungen verfügbar sind.

Generieren und hosten Sie Audio-Plugins

Matlab Geschriebene Audioverarbeitungsalgorithmen AlsStanditmäßigeAudions的Eterlelen Sie ProdotypenFür;Verwenden Sie Externe Audio-Plugins AlsScendäreMatlab-Objekte。

Generierung von Audio-Plugins

Generieren Sie VST-Plug-ins, AU-Plug-ins und eigenständige ausführbare Plug-ins direkt aus MATLAB-Code, ohne dass eine manuelle Gestaltung von Benutzeroberflächen erforderlich ist. Für fortgeschritteneres Plugin-Prototyping generieren Sie fertige JUCE C++ Projekte (erfordert MATLAB Coder™).

Automatische Generierung von VST-Plugins Aus Matlab-Code - Mathworks（AES-Paper）

Audio-Plugin-Beispielgalerie

Entwickeln Eines Audio-Plugins

Beispiel für einen parametrischen Multiband-EQ-Filter: Aus MATLAB-Code generiertes VST-Plugin mit Ausführung in REAPER.

举办externer Audio-Plugins

Verwenden Sie externe VST- und AU-Plugins als reguläre MATLAB-Objekte. Ändern Sie Plugin-Parameter und verarbeiten Sie MATLAB-Arrays programmatisch. Automatisieren Sie alternativ Zuordnungen von Plugin-Parametern zu Benutzeroberflächen und MIDI-Steuerelementen. Hosten Sie aus Ihrem MATLAB-Code generierte Plugins, um die Effizienz der Ausführung zu erhöhen.

Hosten Externer Audio-Plugins

Beispiel für ein externes VST-Plugin für die Audio-Geräuschunterdrückung (Accusonus ERA-N) und programmatische Schnittstelle in MATLAB.

Eingebettee Ziel-und Echtzeit-audiosysteme

Verwenden Sie Add-On-ProdukteFürIeGenierungvon C代码，UM AudioverarbeitungsDesigns AUFSoftwareGerätenZu Impliedieren und VelalIndungen Mit Mehrkanal-audioschnittstellen Zu Automatisieren。

Kostengünstige und mobile Geräte

Erstellen您Prototypen毛皮Audioverarbeitungsdesigns auf Raspberry Pi™ mithilfe platineneigener oder externer Mehrkanal-Audioschnittstellen. Erstellen Sie interaktive Steuerbereiche als mobile Apps für Android^®- oder iOS-Geräte.

AudioEffekteFürios-geräte

Parametrischer Audio-Equalizer auf Raspberry Pi

金宝appSimu金宝applink-support-paketfürraspberry pi-hardment

Eine Raspberry Pi 3-Platine.

Systeme ohne Latenz

Erstellen您Prototypen毛皮Audioverarbeitungsdesigns mit Ein- und Ausgaben aus einer einzigen Abtastung für die adaptive Rauschunterdrückung, die Validierung von Hörgeräten oder andere Anwendungen, für die die Round-Trip-DSP-Latenzzeiten minimal sein müssen. Automatische Übertragung direkt aus Simulink Modellen auf Speedgoat Audiohardware und ST Discovery Platinen.

Parametrischer Audio-Equalizer für STM32 Discovery-Platinen

Unterstützung von ST Discovery-Platinen in Embedded Coder

Unterstützung von Speedgoat-Hardware für Echtzeit-Simulationen und -Tests in Simulink Real-Time

Cochlear Ltd. optimiert die Entwicklung von Klangbearbeitungsalgorithmen für Cochlear Implantate