技术文章及通讯

用MATLAB音频处理算法保护濒危猫头鹰物种

作者:Mutsumi Saito,富士通九州网络技术有限公司


布莱克斯顿鱼猫头鹰是世界上最稀有的鸟类之一(图1)。目前日本的猫头鹰数量估计不到200只,日本环境部已将布莱克斯顿鱼猫头鹰列为濒临灭绝的物种。

图1。布莱基斯顿的鱼猫头鹰。这是最大的猫头鹰种类(图片来源:日本野生鸟类协会)

图1。布莱基斯顿的鱼猫头鹰。这是最大的猫头鹰种类(图片来源:日本野生鸟类协会)

该物种数量的迅速下降是由于其河岸森林栖息地的广泛丧失。为了保护布莱基斯顿的鱼鸮并增加它们的数量,日本野生鸟类协会(WBSJ)正在对猫头鹰的栖息地和地位进行研究。这一结果将有助于保护主义者采取措施防止进一步的衰退。

为了支金宝app持这项研究,富士通九州网络技术公司开发了一个MATLAB®自动识别布莱基斯顿鱼猫头鹰叫声的不同音频模式的应用程序。通常情况下,雄性和雌性猫头鹰成双成对,整夜交换叫声。MATLAB应用程序使研究人员能够准确地从森林中录制的音频中识别这些呼叫。在过去,研究人员用与录音时间相同的时间来听录音。使用MATLAB应用程序,他们可以在两到三分钟内准确识别同一录音中的所有猫头鹰叫声。

自动化一个主观的、劳动密集型的过程

当WBSJ开始这个项目时,研究人员花了几个小时在森林里听猫头鹰的叫声。事实证明,这种方法很困难,研究人员很快改变了策略,在森林中放置了许多数字录音机,以捕捉许多地区的声音。

每个季节有数千小时的音频-数百GB的数据捕获,识别猫头鹰叫声的过程非常耗时,并且高度依赖于个人研究人员的技能。探测到远离设备的猫头鹰的叫声几乎是不可能的。显然,需要一种更加自动化的方法。

当时,富士通支持WBSJ保护日本鹤的努力。金宝app基于这次合作期间建立的关系,WBSJ要求富士通开发能够分析数字录音并自动识别Blakiston的鱼猫头鹰叫声的软件。这一要求与富士通集团的生物多样性行动原则相一致,该原则促进了IT解决方案在生物多样性保护中的应用,我同意开发软件来支持保护Blakiston的鱼猫头鹰的活动。金宝搏官方网站金宝app

开发呼叫识别算法

开发该软件的第一步是通过格式转换和滤波来准备用于频谱分析的声音数据。数字录音机以44.1kHz的采样率捕获声音数据,并将其存储为WAV或MP3文件。MP3文件中的数据是经过压缩的,因此我使用MATLAB将其重新格式化为未压缩的脉冲编码调制(PCM)格式。

猫头鹰的叫声在200-300Hz范围内。为了使呼叫检测更容易,我使用SampleRateConverter系统对象™来自DSP系统工具箱™。

我的下一个任务是光谱分析。在MATLAB中,我开发了一种算法,将数据划分为段,并对每个段进行傅里叶变换,分析其频率特性。然后,算法分析频谱模式并确定峰值频率(图2)。

图2。分析猫头鹰叫声频率特征的过程。

图2。分析猫头鹰叫声频率特征的过程。

该算法将输入数据中峰值频率的时变模式与从处理实际Blakiston鱼猫头鹰的音频数据中得出的参考模式进行比较。只要测量的模式与参考模式足够相似,算法就会记录音频段的时间戳,供WBSJ研究人员将来参考。

一个用于验证和可视化结果的独立应用程序

为了使WBSJ的研究人员更容易使用自动检测算法,我开发了一个图形界面,然后使用MATLAB编译器™创建了一个独立的应用程序,研究人员可以在任何PC上运行,即使他们没有安装MATLAB。使用这个界面,研究人员首先选择一个录制的音频文件进行分析。在算法分析了音频并生成了猫头鹰呼叫的时间戳列表后,研究人员可以查看每个日志条目,以验证它是真实的呼叫。使用该界面,研究人员可以播放每次呼叫的音频录音,并查看显示布莱基斯顿鱼猫头鹰呼叫特征“m”形状的呼叫频谱图(图3)。

图3。用MATLAB开发的接口,用于检测,可视化和验证Blakiston的鱼猫头鹰的呼叫。

图3。用MATLAB开发的接口,用于检测,可视化和验证Blakiston的鱼猫头鹰的呼叫。

识别单个猫头鹰和其他物种

WBSJ的研究人员已经使用该软件来识别布莱基斯顿的鱼猫头鹰叫声,并被要求改变算法来识别布莱基斯顿的鱼猫头鹰叫声。为了进一步支持保护生物金宝app多样性的努力,富士通九州网络技术公司计划将自动鸟类叫声识别扩展到其他物种。

发布于2017年- 92949v00