主要内容

为诊断功能设计器组织系统数据

诊断特性设计器App允许您交互式地分析数据,并开发可以区分来自健康系统和降级系统的数据的功能。该应用程序对一系列类似系统(如机器)的测量数据和信息进行操作。要使用该应用程序,首先必须将数据组织成应用程序可以导入的表单。组织数据的一种方法是使用数字矩阵,它可以捕获所有的测量数据。但是,您也可以使用更灵活的格式,如表格,它允许您合并其他信息,如健康状况和操作条件。有了这些信息,您可以探索应用程序中的功能,并评估功能区分不同特定条件的能力。

数据的集合体

数据分析是任何状态监测和预测性维护活动的核心。

数据可以来自系统上使用传感器的测量,如加速度计、压力表、温度计、高度计、电压表和转速表。例如,您可以访问以下测量数据:

  • 系统正常运行

  • 系统处于故障状态

  • 系统运行的寿命记录(run-to-failure数据)

对于算法设计,还可以使用运行Simulink生成的模拟数据金宝app®您的系统在各种操作和故障条件下的模型。

无论是使用测量数据、生成数据,还是两者都使用,您经常会有许多信号,范围在一个时间跨度或多个时间跨度上。您还可能有来自许多机器的信号(例如,来自许多按照相同规格制造的独立发动机的测量值)。您可能拥有表示正常操作和故障条件的数据。评估用于预测性维护的有效特征需要组织和分析这些数据,同时跟踪数据所代表的系统和条件。

数据的集合体

在预测性维护工具箱™中,组织和管理多面数据集的主要单元是数据集成。一个系综是数据集的集合,通过在不同条件下测量或模拟系统而创建。

例如,考虑一个传动齿轮箱系统,其中有一个加速度计来测量振动,一个转速计来测量发动机轴的旋转。假设您运行引擎五分钟,并记录测量信号作为时间的函数。你还可以记录引擎的寿命,以行驶里程来衡量。这些测量产生以下数据集。

现在假设您有一个由许多相同的发动机组成的车队,并记录来自所有这些发动机的数据。这样做会产生一系列数据集。

这组数据集是系综,集合中的每一行都是a成员合奏的。

集合中的成员是相互关联的,因为它们包含相同的数据变量。例如,在所示的集合中,所有成员都包括相同的四个变量:发动机标识符、振动和转速表信号以及发动机年龄。在该示例中,每个成员对应于不同的机器。集成还可能包括同一台机器在不同时间记录的数据变量集。例如,下图显示了一个集成,其中包括来自同一引擎的多个数据集,这些数据集随着引擎老化而被记录下来。

在实践中,每个集成成员的数据通常存储在单独的数据文件中。因此,例如,您可能有一个文件包含引擎01在9,500英里的数据,另一个文件包含引擎01在21,250英里的数据,以此类推。

整体变量

集成中的变量有不同的用途,因此可以分为几种类型:

  • 数据变量(DV) -集成成员的主要内容,包括用于分析和开发预测性维护算法的测量数据和派生数据。例如,在图示的齿轮箱组合中,振动而且转速表是数据变量。数据变量还可以包括派生值,例如信号的平均值,或信号频谱中峰值幅度的频率。

  • 独立变量(IV) -识别或排序集合成员的变量,如时间戳、工作时数或机器标识符。在测量变速箱数据的集合中,年龄是一个自变量。

  • 条件变量(CV) -描述集成成员的故障状态或运行状态的变量。条件变量可以记录故障状态的存在或不存在,或其他操作条件,如环境温度。在集成齿轮箱数据中,传感器的健康可能是一个条件变量,它的状态对于每个引擎都是已知的。条件变量也可以是派生值,例如编码多个故障和操作条件的单个标量值。

数据变量和自变量通常有很多元素。条件变量通常是标量。在应用程序中,条件变量必须是标量。

表示应用程序的集成数据

您可以使用三种通用方法中的一种来组合集成数据并将其导入到应用程序中。所有这些方法都要求集成成员都包含相同的变量。

创建单个成员数据集

以单个数据集的形式导入数据(每个成员一个数据集),并让应用程序将这些数据集组合成一个集合。当您在导入过程中选择其中一个成员数据集时,应用程序将显示工作区中具有相同变量的所有数据集,因此是兼容的。

这种方法在导入数据之前只需要最少的设置。如果要用新成员更新集合,则必须再次导入所有成员。

创建集成数据集

导入从成员数据集中创建的单个集成数据集。集成数据集的每一行表示一个成员。

这种方法在导入数据之前需要进行更多的设置。当您有更大的成员集时,它可能比单独的方法更实用。如果你想用新成员更新集合,你可以在应用程序之外通过添加到你现有的表来做到这一点。然后导入更新后的表。

有关从单个成员矩阵创建集成数据集的示例,请参见为诊断特征设计器准备矩阵数据

创建集成数据存储对象

导入一个集成数据存储对象仅包含成员文件的名称和路径,而不导入数据本身。该对象还包括应用程序与外部文件交互所需的信息。

当您有大量数据和变量时,这种方法是最好的。集成数据存储可以帮助您处理这些数据,无论是存储在本地还是存储在远程位置,例如使用Amazon S3™(简单存储服务)、Windows Azure的云存储®Blob存储,或Hadoop®分布式文件系统(HDFS™)。

通常,当你开始在应用程序中浏览数据时,你希望导入相对较少的成员和变量。但是,稍后,您可能希望通过引入更大的样本量来测试关于特征有效性的结论。集成数据存储是处理大量数据的一种方法,特别是当数据大小超过MATLAB的内存限制时®

有关集成数据存储对象的更多信息,请参见用于状态监测和预测性维护的数据集成

数据集导入的数据类型和约束

该应用程序接受各种数据类型,包括数值矩阵和包含条件变量标量和嵌入式测量时间表的表格。

在导入数据之前,它必须已经是干净的,并进行了异常值和缺失值删除等预处理。有关更多信息,请参见状态监测与预测性维护的数据预处理

有关数据类型和约束以及实际数据导入的详细信息,请参见将数据导入诊断功能设计器

另请参阅

|||

相关的话题