Gabriele Bunkheila, MathWorks
越来越多的应用需要在时间序列和传感器数据上联合使用信号处理和机器学习技术。MATLAB®通过在单一环境中提供全方位的建模和设计能力,可以加速数据分析和传感器处理系统的开发。
在本次网络研讨会中,我们将展示一个分类系统的例子,该分类系统仅基于人类智能手机产生的加速度计信号,就能识别人体所从事的身体活动。
我们介绍了MATLAB中常用的信号处理方法(包括数字滤波和频域分析),这些方法有助于从原始波形中提取描述特征,并展示了并行计算如何加速大型数据集的处理。然后,我们讨论如何以编程和交互方式探索和测试不同的分类算法(如决策树、支持向量机或神经网络)。金宝app
最后,我们演示了使用MATLAB自动生成C/ c++代码来部署嵌入式传感器分析的流分类算法。
记录时间:2018年3月21日
欢迎参加本次网络研讨会,讨论使用MATLAB进行传感器数据分析的信号处理和机器学习技术。我叫加布里埃尔·邦凯拉,是MathWorks产品管理团队的一员。我的背景是信号处理,这也是我大部分职业生涯都在这里度过的领域,帮助工程科学家将MATLAB应用于他们自己的挑战。
在本次网络研讨会中,我将讨论一些标准MATLAB技术在需要联合使用机器学习的研究问题和产品设计工作流中的应用,例如,信号或时间序列的聚类或分类方法,即采样值随时间变化。
正如我们将看到的,这些问题的复杂性很大程度上源于对机器学习和信号处理领域知识的需求。这通常会带来挑战。无论你是否不熟悉信号处理,机器学习,或两者都不熟悉,或两者都不熟悉,我希望会议将帮助你理解MATLAB如何可以大大加快这些问题的算法设计工作流程。
我们也看到了一个不断增长的行业趋势,将机器学习算法与单一处理一起推向嵌入式设备,更接近实际的信号传感器。在这里,我将把这类应用程序称为传感器数据分析或嵌入式分析。因为这类产品的开发会带来额外的工程挑战,所以我认为在会议结束时分下载188bet金宝搏配一些时间来回顾MATLAB为这些类型的工作流提供的额外支持是很有用的。金宝app
这是我们要看的课程列表。我们将花相当多的时间重新讨论如何将常见的信号处理方法应用于准备或预处理信号以及提取描述性特征。我将展示如何在MATLAB中选择、训练和测试分类或模式识别算法,包括一些简单的方法来提高计算密集型问题的性能。这样做将使我们有机会探索许多基本的MATLAB功能,从交互式应用程序到内部语言构造,这些功能支持并加速工作流的算法开发。
最后,我们将讨论一些MATLAB用于在线预测系统设计的功能,包括DSP功能的设计和仿真,以及预测算法生成源代码,使其在嵌入式架构上运行。
我稍后会回到幻灯片上。这一小时的大部分时间,我将讨论一个运行MATLAB的实际例子。你现在看到的是用智能手机捕捉加速度计信号的三个组成部分。这些信号是由受试者在身体上固定位置佩戴智能手机并进行不同的身体活动产生的。我们在运行一个算法,就像它在运行实时信号一样。但在本例中,我们使用标记的记录数据进行验证。
所以我们知道了基本事实。但我们也试图通过信号处理和机器学习方法自动了解它们在做什么。正如你所看到的,大多数时候我们都能成功地猜测那个活动。
现在我想说一个简单的观点这只是一个简单的例子用加速度计数据行走。但是,我将讨论的技术与广泛的应用以及大多数类型的采样信号或时间序列相关。
为了说明我的观点,我收集了一个简短的例子列表,这些例子是我个人与MATLAB用户一起工作时遇到的,一般来说,他们使用相同类型的技术。这些已经捕获了许多不同行业的用例,如电子、航空航天、国防、金融、汽车。再说一次,即使这只是一个随机的例子列表。我们在这里讨论的技术的相关性要广泛得多。
在返回MATLAB之前,我将利用最后一张幻灯片来回顾我们刚才看到的不同示例。我们从智能手机中获取加速度样本的三个分量。我们预测受试者的身体活动是在六种不同的选项或课程中进行选择,步行、上楼、下楼、坐、站和躺下。
通过分类算法进行预测。分类描述了一种流行的机器学习算法。关键思想是猜测或预测一个新样本的类别,在这种情况下,信号缓冲器,基于之前对类似数据的知识。它的工作方式是,首先,用大量已知或标记的情况来训练算法,优化其自由参数,以尽可能准确地识别这些已知情况。
一旦训练完成,它就可以在未知的新数据上运行,从而对新数据最可能的类进行猜测或预测。一般来说,培训阶段比测试或运行时阶段更需要大量数据和计算。因此,对于嵌入式应用程序,在主机系统或计算机集群上运行培训阶段并不少见,而只是在嵌入式产品上部署一个固定的、经过预培训的算法。
无论训练或运行时使用,分类器都不太可能处理这样的原始波形。在实践中,对于每一个信号段或缓冲,一旦你有了一种提取一组有限的测量,通常称为特性,从原始波形,底线选择使用什么功能是他们应该捕获信号在同一类之间的相似之处和差异的不同。我们将用剩下的大部分时间来展示如何使用MATLAB来设计这两个大算法步骤,从最初的探索阶段开始。
现在,作为一个快速的笔记,完成一个类似的任务或项目的关键部分是参考数据集的可用性。这将是一组在受控实验中获得的信号记录,并仔细标记,以使信号已知并与正确的活动相关联。对于这个例子,我借用了来自西班牙和意大利的两个研究小组的数据集,可以在这张幻灯片的地址找到。
我希望这个问题现在已经很清楚了。回到MATLAB。在下面的文章中,我将假设您熟悉MATLAB的基础知识,包括脚本和函数以及基本的绘图和可视化。
为了让您了解这个示例,我将使用一个由许多代码单元组成的脚本,这些代码单元可以独立执行。我将跳过第一个单元格,在一开始我就用它来启动已完成的应用程序。对单元格执行此操作将加载部分数据集并绘制它。
现在我们不要太在意我是如何加载数据或生成此图的。让我们看看我们现有的数据。我们有一个向量,acc,包含一个物体在一段时间内的垂直加速度样本。数据集本身就是30个不同主题的3D加速记录。加速度将以每秒50个采样的速度采样。这就是采样频率变量fs的含义。我们还有时间向量t,与acc长度相同,这很好。
T和acc可以一对一地绘制。图中显示,对于这个主题,我们有大约8分钟的样本。要知道这里的时间间隔是有规律的。在某些应用中,情况可能并非如此,或者样品可能丢失。但是请记住,MATLAB有很多技术来规范和预处理这些类型的信号。
需要注意的另一个明显的东西是另一个长向量actid,它是活动ID的简写,它告诉我们每个数据样本对应的活动是一个1到6之间的整数。我们可以通过查看剩余的变量acc标签来解释这些整数,所以1是走,2是上楼梯,3是下楼梯,等等。
因此,这里的图看起来非常类似于我们的最终目标,即识别给定部分信号的活动。但请记住,这是已知的,标签数据。我们只是将可用信息可视化。我们想做的是设计一种方法,可以从这些信息中学习,在没有先前知识的情况下,对新数据进行猜测。
我们怎么做呢?第一次尝试时,我们会尝试用直观的方法。例如,在这个图中,你已经看到加速度波形确实看起来不同,取决于活动。你可以看到几乎所有活动的平均值都在10左右,即g或9.8,而1更接近于0。你猜怎么着?这是因为物体与重力场的方向不同。
然后有三个看起来相当静止——毫不奇怪——坐着、站着和躺着,而其他三个似乎上下摆动得更多。我们可以从很简单的方法开始,对部分连续样本进行一些统计测量不管它们在时间上如何分布。
例如,分别观察行走样本和铺设样本的分布,我们可以看到,仅计算与阈值比较的平均值,因此,你看,5,这里将给我们一个很好的机会来区分两者。比如说,行走和站立之间的考虑类似,但在这种情况下,我们可能需要测量标准偏差,并将其与1或2米/秒的平方进行比较。
但是如果我们必须找出普通步行和上楼之间的区别呢?在这种情况下,平均值和标准偏差或分布的宽度看起来非常相似。在这里,你真正应该考虑的是一些更高级的分析,即价值如何随时间变化,观察事物,例如,振荡的速率或形状。
一个直观的原因可能是,人们下楼梯时比上楼梯时移动得更快,或者不同活动的动作类型不同。这正是信号处理方法开始发挥作用的地方。
在此之前,让我强调一下我刚才所做的。我只是随意地画了三个直方图,并很快地讨论了它们的含义。如果你必须从头开始用手做的话,即使是这个任务也可能是相当困难的。但这类东西在MATLAB中都是单个函数。所以,尽管我使用了一个预先编辑的功能,把这两个图放在一个图形中,并给它们正确的颜色,但在它里面,对直方图功能的一个调用为我做了所有艰苦的工作。
与旧的历史图相反的直方图被引入并发布于MATLAB的R 2014b。它为绘制直方图提供了一种新的、更有效的方法。
现在,为了分析随时间的变化,我们想把重点放在身体运动引起的加速度上。可以合理地假设,当重力作用几乎恒定时,身体运动会产生更快的变化。如果我有两个贡献被混合到一个信号中,我想把它们分离出来,那么一种常用的技术就是数字滤波。
例如,在这种情况下,我们希望只保留比大约每秒一个周期更快的振荡,这是平均每秒步数的粗略数字,而放弃较慢振荡的贡献。用正确的术语来说,这需要设计一个合适的高通滤波器,并将其应用到我们的数据中。我将在整个过程中重复这些想法。
现在设计和应用数字滤波器是困难的,除非你有正确的工具。特别是设计阶段,需要相当多的数学知识和大量特定领域的知识。在MATLAB中,有许多不同的方法可以设计一个数字滤波器。例如,可以选择完全通过编程来实现,这意味着只能使用MATLAB commons,或者通过内置应用程序。
让我们首先看看后者是什么样子的。当你第一次处理一个问题时,使用应用程序通常是一个好主意。要做到这一点,我到MATLAB工具栏的Apps标签,向下滚动到信号处理和通信应用程序组。在这里,我将选择过滤器设计和分析工具。对于更高级的过滤器设计,您可能还想尝试filter Builder应用程序。
过滤器设计和分析工具包括几个部分。例如,此筛选器规范窗格将帮助我们为筛选器指定正确的要求。下面左边是我们开始定义我们想要实现的目标的地方。在这种情况下,我将选择一个高通滤波器。但是你可以看到很多其他的选择也是可能的。
在这里,有一个更专业的选择。如果你知道数字滤波器,你可能知道FIR和IR是什么意思。这里列出的设计方法可能会引起相当多的共鸣。在这里,我将跳过细节。我会从IAR选项中选择一个。移到右边,我需要做的就是使用上面的规范窗格捕获我的需求。
我要说的是我们使用的采样频率是50赫兹。我们想保持不变;也就是说,我们想要衰减1或0db。所有信号成分的振荡速度超过每秒一次或1赫兹。让我们大方一点,假设是0.8赫兹。然后在另一个值fstop左边的所有东西,至少被一个给定的dB衰减。我把这个设为,比如说,0.4赫兹相应地,这个停止值设为60db。这意味着所有慢于每秒0.4次的振荡都将被滤波器缩小1000倍。
最后,通过按下设计,工具为我们做了所有的工作。最后我们得到了一个满足我们要求的过滤器。在这个应用程序中,我们有一组可用的分析工具来验证过滤器的行为是否符合预期。
例如,现在我们看的是所谓的频率保证金表响应。如果我需要确认这是否符合规范,我可以覆盖一个规范掩码。或者,如果我想了解瞬态行为,按下一个按钮,我可以快速想象出像阶跃或脉冲响应这样的事情。
一旦我的滤波器设计好了,我真正想做的是在MATLAB中使用它将它应用到我的信号上。为此,我可以选择两种方法。我可以将过滤器作为一个或多个变量导出到我的MATLAB工作区。或者,我可以生成一些MATLAB代码,通过编程脚本交互地实现我刚才所做的一切。
您在这里看到的代码是自动生成的,就像这个函数的头文件告诉我们的那样。然而,我也可以决定单独使用类似的注释。为我自动生成这个也可以帮助我获得一些见解,以便下次我可以更快速地以编程方式设计我的过滤器。但更重要的是,现在通过使用这个函数调用,我可以从自己的代码中快速实现过滤器。
我不会放弃这个新功能,因为在我的工作文件夹中已经有一个以前保存的版本,叫做HP filter。回到我的脚本,你可以看到我用一行代码通过预设函数创建了一个过滤器。在下一行,我将过滤器应用到垂直加速度上。这就产生了一个新的信号,我们希望在这个信号中只发现身体运动的贡献。如果我执行这一节,我也画出了新的滤波信号与原始信号的对比图。
在图中,我们可以看到新的信号现在都以0为中心,正如预期的那样。这是理想的。一些瞬态行为由于滤波器的存在,这是完全正常的。
现在让我一次只专注于一项活动。我该怎么做呢?有一个非常有效的MATLAB特性叫做逻辑索引,我可以用它来达到这个目的。看看这个。假设我想分离信号的移动部分。活动类型存储在向量actid中。当actid = 1时,我在这里检查。因为我这里有两个工作部分,你只看时间小于250秒的时候。
这里的结果是一个与我的信号长度相同的向量,我可以使用它来选择符合这些标准的样本。这是我们的工作部分。我们可以放大并确认信号相当有规律地振荡,几乎是周期性的。现在的问题是,我如何测量它振荡的速度或一些参数来量化这些振荡的形状或指纹?
一个好的答案是通过观察信号的频谱表示,或者有人会说通过计算它的FFT。要比FFT好得多,FFT是一种非常低级的操作,正确的说法是功率谱密度,它可以使用FFT和其他一些部件。再一次,我最好的选择是专注于我的目标,看看MATLAB是否可以简单地为我做到这一点,就像情况一样。
这里有很多函数可以用来估计信号的功率谱密度,我使用的是威尔士方法,这是一种非常流行的方法。根据这里的代码,我有我的光谱。在x轴上,我的频率是采样频率的0到1/2,即50赫兹。在y轴上,我有dB/Hz或功率密度。那么,当这个图中的值较高时,这个区域很可能会携带我想要的信息。
对于我们的信号,这种峰值在0到10赫兹之间,能量更高,包含了很多可测量的信息。如果你上过突然信号理论课,你会记得周期性或几乎周期性信号的频谱。我们可以看到一个基本频率,大约是1赫兹,在这个频率的几倍处有一些谐波。
为了从中提取信息,这些峰值之间的频率距离就是时域振荡的速率。峰值的相对振幅描述了振荡的形状,有点像音乐信号的音色。为了验证这些,我还将展示在0到10赫兹范围内行走的频谱。
在这里,上楼梯会产生更慢、更平滑的运动,因为较慢的山峰都被推到左边。时域中的平滑度会导致基波右侧的峰值非常快地减小,这表明时域转换更加柔和。如果这听起来不熟悉,那么想想纯正弦波的频谱,它的频谱中有一个单峰,而方波的频谱中充满了高频谐波。
一旦确定了特殊山峰携带信息,我们希望有一种程序化的方法来测量它们的高度和位置。这是下一个问题。如何识别曲线中的峰值?与一些人所想的相反,这并非微不足道。信号处理工具箱(Signal Processing Toolbox)提供了一个名为“查找峰值”(Find Peaks)的函数,它正是为此而构建的。
如果我们使用它,而不提供其他信息,但我们的原始光谱密度,那么它将返回在我的plot中发现的完整的局部峰值集。但如果我们花更多的精力去定义我们想要的东西,例如,它应该返回多少个峰值,我们需要的峰值突出度是多少,或者我们期望的附近峰值之间的最小距离是多少,那么结果就会令人鼓舞得多。只用几行代码,我们现在就有了一个可以自动化的程序化度量方法。它高度描述了我们的信号特征。
在我一开始给你们看的例子中,我使用了更多的信号处理测量来提取其他特征。但我想现在你们应该明白了从信号中提取特征的探索性方法的一般精神。在这一阶段的最后,我所做的是将所有有用的测量值收集到一个函数中,以便对于每个新的可用信号段,我能够自动生成描述它的所有测量值或特征的集合。
让我快速给你们展示一下。对于这三个方向上的每一个新的加速度采样缓冲器,我都在计算平均值,过滤掉重力的贡献,计算均方根值,测量谱峰,以及其他一些事情。如果我看一下谱特性子函数,你可以认出几分钟前的PWELCH和Find Peaks函数。
总的来说,这个函数为每一个作为输入传递给它的新信号缓冲区返回66个高度描述性的特性。我真正喜欢它的地方是,如果我测量代码行的净数量,不包括注释和空行,总和只有54行。这是针对66个特性的54行代码,或者比每个特性的一行代码要少得多,我发现这表明了MATLAB语言是如何简洁地有利于理解和提高生产率的。
有了这些,我想我们现在可以说我们的探索工作流程已经进行了一半。我们提出了一种方法来提取每个给定的信号段的有限的特征集。我们现在需要设计一个能够学习如何将测量值(在本例中是66个特征集)与一个类或6个可用选项中的一个活动选择关联的分类器。
为了使用分类器,我们首先需要将所有数据映射到新的基于特征的表示。让我打开另一个脚本,快速地向您展示我的意思。假设我们首先重组了我们的数据,比如8分钟的样本乘以30个实验对象,在大量等长的小缓冲中,比如128个样本。我们现在做的是,对于每一个缓冲区,我们调用特征提取函数来计算66个特征。最后我们得到了一个新的特性数据集,它的列数和可用缓冲区的行数一样多。
由于分类算法通常需要学习大量数据,从整个数据中提取特征可能需要很长时间。如果在这个探索阶段,第一阶段决定使用不同的功能,那么整个操作需要重新开始。让我在小范围内说明我的意思。
让我们将这里的数据缓冲区数量减少到仅仅600,然后运行这个。我在循环开始前启动一个计时器,然后马上停止。当我的600个数据缓冲区一个接一个地转换为特性时,我们可以监控这个过程。这个过程大约在17秒后结束。让缓冲区的数量增长,这个会随着这个线性增长。
现在想想这个。for循环中每个循环的计算都是相互独立的。因此,如果我们有更多可用的计算资源,我们可以开始考虑在可用的计算节点上分配负担。我想你们大多数人会认为这是一项艰巨的任务。所以,让我来挑战这种看法。
这里我要做的是将我的for关键字更改为parfor,确保启用了并行池,然后再次运行我的循环。缓冲区现在由在后台运行的四个服务器MATLAB工作会话池异步处理。我只花了原来的一小部分时间就完成了。
实际性能增益将根据特定问题而变化。底线是,因为我的机器安装了并行计算工具箱,所以我能够在本地打开相当于我机器上可用内核数量的MATLAB Worker。我这里有四个核心。但有了集群这样的外部资源,这个数字可以随意增加。然后,我可以通过简单地将for更改为parfor(类似于parallel for)来分发long for循环的独立迭代。
完成后,我们可以保存特色数据集,回到问题所在。我们把问题留到了需要选择分类算法的阶段。现在数据已经准备好了。当您需要分类器时,您可以在大量不同类型的算法中进行选择。MATLAB文档提供了一些关于哪些类型最适合哪些问题的指导,但整个尝试和错误的过程可能会令人生畏,特别是如果您不熟悉一般的机器学习,或者不熟悉合理数量的分类算法。
为了解决2015a版的问题,MATLAB推出了一款名为Classification Learner的新应用程序。您可以从“应用程序”选项卡中选择它。但是,让我用预设的功能数据加载它,然后从我的脚本中运行common Classification Learner来打开应用程序。
首先,我加载我的数据,并在右侧选择此选项,以省去部分数据集以进行验证。要知道,在将数据加载到脚本中之前,我还要将其设置为MATLAB表格。这将允许该工具将名称与我的功能相关联,并为每个功能显示一些简单的统计信息。我的数据还包括每个可用特征向量的actid和activity标签。
当我单击右侧的“导入数据”时,我可以简单地看到二维要素空间中的数据点。我可以选择我的66个特性中的哪一个用于x,哪一个用于y,并对我的数据样本的可分离性有一个感觉。此时,我们只需从该目录中选择不同的分类器算法,并使用此按钮在数据集上逐个训练它们。
你真的不需要知道这些算法是什么或者它们是如何工作的,以及它们需要哪些参数才能工作,因为工具会为你聪明地选择它们。如果你愿意,你可以使用这个高级按钮来改变它们。我希望您可以看到,当培训完成时,该工具会在每个选定选项旁边显示一个准确性摘要,并以绿色高亮显示准确度最高的选项。
在这个阶段,您可能还需要更深入地理解Classifier的性能。这个应用程序有一些诊断选项,比如,混淆矩阵,它显示了我们的预测如何映射到数据集中的实际已知值。例如,这里的全绿色对角线,并且在它外面没有实例,表示100%的预测精度。
在MATLAB应用程序的许多其他情况下,您可以将交互式探索工作转换为一些代码,以编程方式自动化相同的步骤。在我们的脚本中,我们使用的是完全来自相同工作流的预设版本。这里有趣的是三行代码模式,包括为分类器选择设置、训练(注意这里的fit关键字)并在新数据上运行它以返回预测的类。
我们可以在脚本中使用这个生成的函数来返回一个训练过的分类器,并将其用于新的未知特征向量。我现在还不会这么做,因为我还有更多的事情要讲。分类学习器提供了一种直观的方式来访问大量的传统分类器,这些分类器随统计学和机器学习工具箱一起提供。
解决这个问题的另一种方法是神经网络。同样,在这种情况下,从头开始设计和训练网络将非常复杂。但是,神经网络工具箱提供了应用程序和功能,可以快速启动并设计一个只需几行代码的功能网络。
出于时间的考虑,从另一个角度来看,让我来分享一下在这种情况下如何使用编程方法来完成同样的工作。在这里,我用一行代码在一个隐藏层中初始化了一个有80个神经元的模式识别网络。然后我对它进行了训练,并在测试集中用几行代码返回了预测的类。
如果你曾经接触过神经网络理论,那么你就会知道这些操作背后的数学复杂性是相当大的。试想一下,对于一个[听不见]的网络体系结构和你可能需要考虑的成本函数的所有优化选项,使用反向传播。在这种情况下,大多数成熟的算法都可以使用,因此您可以专注于解决特定问题。当我执行这段代码时,我得到了一个监控训练进度的界面,同时也确认了网络的架构:隐藏层中有80个神经元,66个输入作为功能的数量,6个输出类。
当我们完成后,训练过的神经网络就可以在我的工作区中使用了。同样,通过编程方法,我可以使用它对数据集的整个测试集部分运行预测。就像我们之前交互式地做的那样,我可以编程地生成诊断,就像在这个混淆矩阵的情况下一样。
该报告的准确率约为92%,这是相当不错的,并详细说明了所有预测器类是如何匹配已知值的。举个例子,我们可以注意到很多人把坐着和站着搞混了,反之亦然。这是我们算法需要改进的地方。
现在,让我回顾一下我们取得的成绩。我们能够训练和使用一个分类器,对用信号处理方法提取的高质量特征进行操作。我们解决了一个问题,这个问题需要信号处理和机器学习这两个领域的专业知识,而这个问题没有单一的解决方法,可能需要很长时间才能解决。相反,这只需要几个迭代。我使用了一些不同的应用程序和算法,这些应用程序和算法都很容易使用,而不需要打开任何复杂的书,从零开始编写任何数学程序。一个显著的结果是,信号处理函数能够在仅54行代码中提取66个特征。
现在我想用最后10分钟来讨论一些常见的工程挑战,稍微超出我们之前讨论过的算法探索阶段。假设我们的最终目标是对来自一个新的加速度传感器的信号进行预测。在本例中,我们使用现有的数据集。我们没有问自己很多关于这些数据是如何收集的问题。
总的来说,掌握相关数据可能是我们清单上的第一个问题。我经常与工程师交谈,他们认为要获取真实世界的信号并探索您的算法,您需要两种不同的工具,最终他们会花费相当多的时间在MATLAB和一些外部数据采集软件之间转换数据。但事实证明,MATLAB可以直接连接到许多传感器和数据采集设备。使用这种连接性可以进一步加快您的发现周期。
因为我们的例子使用了来自智能手机的加速计和数据,我想我还应该包括两个免费支持包的参考资料,可从MathWorks网站下载,这两个支持包允许将iOS和Android设备的传感器信号直接传输到MATLAB中。金宝app
现在想想开发工作流的结尾,想象一下你闪亮的MATLAB算法必须在实时系统上实现;例如,在靠近加速度计本身的嵌入式设备上。在这种情况下,不仅最终的实时软件可能会帮助用C或c++重写,而且算法的实际功能也必须在最终产品中重新调整。
机器学习部分可能需要更简单。例如,对嵌入式分类器进行离线预训练,并在只进行在线预测的轻量级版本中实现,这是很常见的。信号处理也可能会有更大的差异。例如,处理来自传感器的信号流的过滤器将不断接受新的样本,并相应地更新它们的内部状态。
如果原始的MATLAB模型没有考虑到这些影响,那么可能在最终的实现中永远无法匹配原始仿真的性能,潜在地危及实际最终产品的成功。
好消息是,MATLAB不仅与初始信号分析和算法探索阶段有关;它们也可以用来模拟实时系统和生成可嵌入的C源代码。详细介绍这些方面超出了本次网络研讨会的范围。但是让我给你们一个关于这个领域的可能的想法。
要介绍的最快的一点是分类器的部署。当我们训练和测试我们的神经网络分类器时,所有的事情都是通过一个我们称之为net的网络对象完成的。它附带了大量的功能。而用于预测的实际数学代码可能很难找到。但是从我的对象网络中,我可以运行这个genFunction方法并生成一个简单的预测函数,该函数只使用基本构造来模拟需要实时发生的事情。
现在让我们来看看数字信号处理的建模。在左边,在extractSignalFeatures。我有我们之前回顾过的54行特征提取函数。这里使用的更多信号处理功能来自信号处理工具箱。这些在我们的探索阶段非常有价值。它们是数据分析任务的最佳选择。但它们并不是为了模拟实时系统的行为。当我们把这些代码放在一起的时候并不是这样想的。
例如,看看我们如何过滤信号。我首先考虑的其实只是一个旁注。但这可能有助于我们进入正确的心态。这里,我们计算每个新信号部分的滤波器系数,即使它们总是相同的。我们一次接收完整的条目序列。我们假设这是一个相当长的手术。当我们这样做的时候,每次我们假设从一个内部状态为零的干净历史的过滤器开始。
现在为了比较,让我看看另一种方法来建模这个过程,它有一个实时的实现。这是buffer。m的另一个函数特性。右边函数中的大部分信号处理来自DSP系统工具箱。这些对象是在系统设计和仿真的思想下开发的。它们用于信号分析可能不太实用。但它们可以用于实时DSP系统的精确建模。
如果我们只看过滤器进行比较,这里是一个过滤器对象,具有内部结构的概念。正如您所看到的,通过在MATLAB中简单地创建一个,您甚至可以通过捕获完整的数据类型规范来获得更精确的行为;例如,对于定点实现。
对象保持其内部状态并声明为persistent。所以在这里退出和重新进入函数会再次发现它处于以前的状态。所以,如果需要的话,它甚至可以一次采集一个样本。而且它仍将按预期运行。
至于系数,它们只在初始化这个持久变量时第一次调用这个函数时计算一次。然后在运行时通过在每个新的数据缓冲区上调用step方法来使用它们。作为一个副作用,这个过滤器只初始化一次,因此可以非常高效地运行。从第二次开始,它只执行严格必要的计算来处理输入。这些属性使它非常适合在信号设计和仿真的上下文中与流信号一起使用。这个新的系统模型的第一个优点,正如我们现在所说的,是通过模拟它,我们可以在嵌入式系统的算法设计的早期验证,并检查行为是否如预期的那样。
我相信这幅图现在看起来很眼熟。这是我在这节课开始时给你们看的来介绍我们的例子。这里的动态模拟提供了一个不同的视角。例如,我可以在从一个活动到另一个活动的转换中检查预测的稳定性。或者另一个应用,我可能需要分析信号,就像我在示波器上做的那样,例如,使用触发器和标记。
这是一个时间范围。但其他类型的可视化也有可能——显然,包括在频谱分析仪的频域。但我们现在不讨论这个。
如果我们看一下生成模拟的代码,我们将再次看到在新的特性提取函数中看到的许多编程实践。例如,我们在每次迭代时使用一个带有新数据处理的while循环。这里的代码对象是我们在连续在线可视化中使用的。在while循环中,我们只是使用前面已经看到的step方法的相同简单构造不断地推入更多数据。
在这个循环的开始,我们以类似的方式使用一个文件读取器对象来递增地处理一个数据文件,而不需要在内存中加载一个潜在的巨大文件或对源数据进行任何复杂的索引。我们只是在开始时传递文件名,然后得到一个新的示例框架,该框架将在每次迭代中使用。
在这里,我还使用了一个缓冲区来帮助我操作一个比系统可能在单个迭代中接收到的更长的数据窗口,所有这些都包装在一个单独的对象中,以隐藏在索引中,并通过相同的步骤接口使用。在这个循环的中间,你可以看到我们用新的DSP模型和轻量级神经网络分类器模拟的预测函数。
除了能够在线模拟我们的系统之外,拥有DSP处理组件和部署的神经网络的实时模型的第二个实质性优势是,我们现在可以从它们自动生成源代码C或c++代码。可以用于嵌入式产品、嵌入式原型,或者只是作为参考与下游软件工程团队共享。
关于这一点还有很多可说的,包括直接生成定点或目标优化c的能力。但我只向您展示其工作原理的总体思路。虽然第一次你也可以通过一个专门的内置应用程序来完成这个工作流,但总的想法是,通过这个简单的公共codegen,我们可以把我们的MATLAB函数从信号缓冲区预测活动,变成一个完全等效的开放C函数,没有附带库。生成的C是完全打开的。在本例中,我没有对生成的代码进行优化。但是有很多特性可以做到这一点,包括生成所有固定代码的能力。
好吧。我想我们已经看到了我想给你们展示的一切。现在让我回到幻灯片。我将回顾一下我们所做的工作,以及我在本演示的各个部分中使用的功能和工具。
信号分析是使用事实上的标准内置函数为我们节省大量时间的第一个领域。信号处理工具箱是所有这些有用的函数的来源。想象一下必须从头开始执行所有这些公式,更不用说查找它们并试图理解它们了。通过简单地将for循环改为parfor循环,并行计算工具箱让我们可以分配计算密集型的for循环。额外的并行计算选项可用于将我们使用的框架扩展到更大的架构,包括计算机集群和云。
统计学和机器学习工具箱不仅可以让我们测试大量的分类器,还可以在分类学习者应用程序中快速探索和比较不同的选项。我觉得这大大加快了我们的发现周期。在探索了一些传统的分类器之后,我们还使用了神经网络工具箱来创建用于模式识别的公共网络拓扑,并对其进行训练和测试。我们还生成了该网络的一个轻量级预训练版本,它使用C热电联产引擎完全支持的基本MATLAB构造捕获运行时计算。金宝app
在巩固了我们的信号处理算法的基础知识后,我们使用DSP系统工具箱中的大量对象对算法的实时实现进行建模。我们对我们的系统进行了一次在线模拟,该系统使用的对象有助于从存储在磁盘上的长信号中流式传输数据。我们使用经过优化的范围来处理流信号的连续可视化,类似于用台式仪器可视化真实世界的信号。
作为一个副作用,我们的在线建模工作使我们的算法在模拟中执行起来更加高效,并使它们能够生成可以直接部署到嵌入式处理器上的C或c++源代码。这就是我们使用MATLAB编码器的地方。
Matlab编码器是一种热电联产引擎,可以将MATLAB算法转换成完全开放的C或C++源代码。关于MATLAB编码器可以做什么,特别是通过生成可嵌入的源代码,还有很多要说的。所以我想我会推荐你们去看一个很棒的介绍性网络研讨会,它以预先录制的形式出现在我们的网站上,叫做“MatlabtoC变得简单”
关于传感器数据分析的信号处理和机器学习技术的网络研讨会已经结束了。我希望这对突出一些您还不熟悉的MATLAB功能有帮助。我的目标是让我使用的代码在接下来的几周可用,以便您可以按照自己的节奏回顾示例。
如果你不得不忘记我今天提到的所有东西,我希望你至少记住以下三个要点。首先,我们的开放式项目之所以成为可能,是因为我们拥有广泛的内置功能,包括信号处理和机器学习。这让我们能够快速尝试不同的选择,而无需从头开始执行任何数学运算。
图片的补充部分是MATLAB环境本身,从基本的可视化功能到生成可重用代码的内置应用程序,不断使用一种语言,使高级事情在几行代码内发生变得容易。
最后,它带您参观了一组MATLAB功能,用于将抽象思想转换为实时算法实现。我们将信号处理算法转化为详细的DSP系统模型,可以随着时间的推移进行模拟。从这些代码中,我们生成了可以在嵌入式平台上重新编译的C源代码。
你也可以从以下列表中选择一个网站:
选择中国站点(中文或英文)以获得最佳站点性能。其他MathWorks国家/地区网站未针对您所在地的访问进行优化。