时拉音频
读入音频信号。听听音频信号并随时间绘制它。
[AudioIn,FS] = audioread(“计数-16-44p1-mono-15secs.wav”);t =(0:size(audioin,1)-1)/ fs;plot(t,audioin)xlabel('时间'')ylabel(“振幅”)标题(原始信号的)轴紧网格在
声音(AudioIn,FS)
采用stretchAudio
申请1.5加速因子。收听修改后的音频信号并随时间绘制它。采样率保持不变,但信号的持续时间降低。
AudioOut = LigressAudio(AudioIn,1.5);t =(0:大小(频声,1)-1)/ fs;plot(t,abusout)xlabel('时间'')ylabel(“振幅”)标题('修改信号,加速因子= 1.5')轴紧网格在
声音(频道,FS)
减慢原始音频信号0.75因素。收听修改后的音频信号并随时间绘制它。采样率保持与原始音频相同,但信号的持续时间增加了。
Auditout = LigressAudio(AudioIn,0.75);t =(0:大小(频声,1)-1)/ fs;plot(t,abusout)xlabel('时间'')ylabel(“振幅”)标题('修改信号,加速因子= 0.75')轴紧网格在
声音(频道,FS)
stretchAudio
金宝app当使用默认的声码器方法时,在频域音频上支持TSM。将TSM应用于频域音频使您能够针对多个TSM因素重用STFT计算。
读入音频信号。听听音频信号并随时间绘制它。
[AudioIn,FS] = audioread('FemaleSpeech-16-8-Mono-3secs.wav');声音(AudioIn,FS)T =(0:Size(AudioIn,1)-1)/ FS;plot(t,audioin)xlabel('时间'')ylabel(“振幅”)标题(原始信号的)轴紧网格在
将音频信号转换为频域。
win = sqrt(hann(256,'定期'));OVRLP = 192;s = stft(isainin,'窗户',赢了,'overlaplencth',OVRLP,'中心',错误的);
将音频信号加速为1.4倍。指定用于创建频域表示的窗口和重叠长度。
alpha = 1.4;Auditout = LigressAudio(S,Alpha,'窗户',赢了,'overlaplencth',ovrlp);声音(呼啸声,FS)T =(0:尺寸(发射机,1)-1)/ fs;plot(t,abusout)xlabel('时间'')ylabel(“振幅”)标题('修改信号,TSM因子= 1.4')轴紧网格在
减慢音频信号倍数为0.8。指定用于创建频域表示的窗口和重叠长度。
α= 0.8;Auditout = LigressAudio(S,Alpha,'窗户',赢了,'overlaplencth',ovrlp);声音(呼啸声,FS)T =(0:尺寸(发射机,1)-1)/ fs;plot(t,abusout)xlabel('时间'')ylabel(“振幅”)标题('修改信号,TSM因子= 0.8')轴紧网格在
默认的TSM方法(声码器)允许您额外应用锁相以增加对原始音频的保真度。
读入音频信号。听听音频信号并随时间绘制它。
[AudioIn,FS] = audioread(“SpeechDFT-16-8-mono-5secs.wav”);声音(AudioIn,FS)T =(0:Size(AudioIn,1)-1)/ FS;plot(t,audioin)xlabel('时间'')ylabel(“振幅”)标题(原始信号的)轴紧网格在
锁相向TSM添加了非竞争计算负载,并不总是需要。默认情况下,禁用锁相。将1.8的加速因子应用于输入音频信号。听听音频信号并随时间绘制它。
alpha = 1.8;TIC AUDIOOUT = LAJRIGAUDIO(AudioIn,Alpha);processingTimewithoutphaseLocking = TOC.
加工节省inewithoutphaseLocking = 0.0798.
声音(呼啸声,FS)T =(0:尺寸(发射机,1)-1)/ fs;plot(t,abusout)xlabel('时间'')ylabel(“振幅”)标题(“修改信号,alpha = 1.8,锁定} = false”)轴紧网格在
对输入音频信号应用相同的1.8加速因子,这次启用锁相。听听音频信号并随时间绘制它。
Tic Auditout = LigressAudio(AudioIn,Alpha,“锁定”,真的);processingtimeewithphaseLocking = TOC.
ProcessingTimewithPhaseLocking = 0.1154.
声音(呼啸声,FS)T =(0:尺寸(发射机,1)-1)/ fs;plot(t,abusout)xlabel('时间'')ylabel(“振幅”)标题('Modified Signal, alpha = 1.8, LockPhase = true')轴紧网格在
波形相似度重叠 - 添加(WSOLA)TSM方法使您可以指定用于搜索最佳信号对齐的最大样本数。默认情况下,WSOLA Delta是分析窗口中的样本数减去相邻分析窗口之间重叠的样本数量。增加WSOLA Delta增加了计算负荷,但也可能增加保真度。
读入音频信号。听音频信号的前10秒。
[AudioIn,FS] = audioread(“rockguitar - 16 - 96立体声- 72 secs.flac”);声音(AudioIn(1:10 * FS,:),FS)
使用WSOLA方法将TSM系数0.75施加到输入音频信号。收听由此产生的音频信号的前10秒。
α= 0.75;Tic Auditout = LigressAudio(AudioIn,Alpha,“方法”那“WSOLA”);ProcessingTimewithDefaultWsoladelta = TOC.
processingTimeWithDefaultWSOLADelta = 19.4403
声音(频道(1:10 * FS,:),FS)
将TSM系数施加0.75到输入音频信号,这次将WSOLA增量增加到1024.收听所产生的音频信号的前10秒。
Tic Auditout = LigressAudio(AudioIn,Alpha,“方法”那“WSOLA”那“Wsoladelta”,1024);ProcessingTimewithIncreaseWsoladelta = TOC.
ProcessionTimewithincreasceficwsoladelta = 25.5306.
声音(频道(1:10 * FS,:),FS)
奥地策
-输入信号输入信号,指定为列向量,矩阵或3-D阵列。该功能如何解释奥地策
取决于复杂性奥地策
的价值方法
:
如果奥地策
是真实的,奥地策
被解释为时域信号。在这种情况下,奥地策
必须是列向量或矩阵。列被解释为单独的通道。
此语法适用于什么时候方法
被设置为'vocoder'
要么'WSOLA'
.
如果奥地策
很复杂,奥地策
被解释为频域信号。在这种情况下,奥地策
必须是AN.L.——- - - - - -m——- - - - - -N阵列,其中L.是fft长度,m是个别光谱的数量,和N是渠道的数量。
此语法仅适用于什么时候方法
被设置为'vocoder'
.
数据类型:单身的
|双
复数支持:金宝app是的
α
-TSM因子TSM因子,指定为正标量。
数据类型:单身的
|双
指定可选的逗号分离对名称,价值
参数。名称
是参数名称和价值
是相应的价值。名称
必须出现在引号内。您可以以任何顺序指定多个名称和值对参数Name1, Value1,…,的家
.
'窗口',kbdwin(512)
'方法'
-用于时间尺度音频的方法'vocoder'
(默认)|'WSOLA'
用于时间缩放音频的方法,指定为包括的逗号分隔对'方法'
和'vocoder'
要么'WSOLA'
.集'方法'
到'vocoder'
使用相位声码器方法。集'方法'
到'WSOLA'
使用WSOLA方法。
如果'方法'
被设置为'vocoder'
那奥地策
可以是真实的或复杂的。如果'方法'
被设置为'WSOLA'
那奥地策
必须是真实的。
数据类型:单身的
|双
'窗户'
-窗口应用于时域SQRT(HANN(1024,'定期'))
(默认)|真正的矢量在时域中应用的窗口,指定为逗号分隔对组成'窗户'
和一个真正的矢量。向量中的元素数必须在范围[1,尺寸(
].向量中的元素数也必须大于奥地策
, 1)OverlapLength
.
笔记
如果使用stretchAudio
使用频域输入,必须指定窗户
与用于转换的相同窗口奥地策
到频域。
数据类型:单身的
|双
'overlaplencth'
-相邻窗口之间重叠的样本数圆形(0.75 * numel(窗户
)))
(默认)|在[0]范围内的标量numel(窗户
)
)相邻窗口之间重叠的样本数,指定为由逗号分隔的对组成'overlaplencth'
并且范围内的整数[0,numel(窗口)
)。
笔记
如果使用stretchAudio
使用频域输入,必须指定OverlapLength
与用于转换的相同重叠长度奥地策
转换为时频表示。
数据类型:单身的
|双
“LockPhase”
-应用身份锁相错误的
(默认)|真的
'wsoladelta'
-用于搜索最佳信号对齐的最大样本numel(窗户
) -OverlapLength
(默认)|非负标量音频输出
- 时间尺度修改音频时间尺度修改音频,返回为独立通道的列向量或矩阵。
WSOLA算法是TSM的时域方法[1][2].WSOLA是重叠和添加(OLA)算法的扩展。在OLA算法中,时间域信号在间隔η处窗口,其中η=元素个数(
.为了构造时间尺度的修正输出音频,窗口以δ为间隔,其中δ≈η/α。α是由式指定的TSM因子窗户
) -OverlapLength
α
输入参数。
OLA算法进行重新创建幅度谱但可以在Windows之间引入阶段跳跃的良好工作。WSOLA算法尝试通过搜索来平滑相位跳转Wsoladelta
在η区间附近取样,以使相位跳变最小。该算法通过迭代搜索最佳窗口,使每个连续窗口相对于先前选择的窗口进行选择。
如果Wsoladelta
被设置为0.
然后,算法减少到OLA。
[1]垂饰,约翰坦和梅纳德米尔尔。“审查音乐信号的时间尺度修改。”应用科学.卷。6,第2期,2016年。
[2]晾干器,约翰坦。“音乐音频信号的时间尺度修改算法”,硕士论文,萨尔兰大学,萨尔布吕肯,德国,2011年。
使用GPUArray.
(并行计算工具箱)输入与之stretchAudio
仅推荐用于具有计算能力7.0(“Volta”)或更高版本的GPU的功能。其他硬件可能无法提供任何性能优势。检查GPU计算能力,请参阅ComputeCompability
在输出中gpuDevice
(并行计算工具箱)功能。有关更多信息,请参阅GPU支金宝app持情况(并行计算工具箱).
有关MATLAB中GPU使用的概述®, 看在GPU上运行matlab函数(并行计算工具箱).
您单击了与此MATLAB命令对应的链接:
在MATLAB命令窗口中输入它来运行命令。Web浏览器不支持MATLAB命令。金宝app
您还可以从以下列表中选择一个网站:
选择中国网站(以中文或英文)以获取最佳网站性能。其他MathWorks国家网站未优化您的位置。