主要内容

清除时间表缺失,重复,或不一致的时间

这个例子展示了如何创建一个常规的有缺失、重复或不统一时间的时刻表。时间表是一种与时间戳或行时间,每一行数据。在常规时间表中,行时间是有序且唯一的,并且不同于相同的常规时间步长。

另外,一些工具箱具有处理数字数组形式的定期间隔时间序列数据的功能。因此,该示例还展示了如何从时间表中导出数据,以便与其他函数一起使用。

行时间存在许多问题,这些问题会使时间表变得不规则。行时间可能会丢失。它们可能会出故障。它们可以是重复的,使用相同的时间创建多个行,这些行可能具有相同或不同的数据。即使它们是存在的,有序的,唯一的,它们也可以因不同大小的时间步长而不同。

时间表提供了许多不同的方法来解决缺失、重复或不一致的时间,并重新取样或聚合数据以创建常规的行时间。

  • 要找到缺少的行时间,使用ismissing

  • 若要删除丢失的时间和数据,请使用rmmissing

  • 要按行时对时间表排序,请使用sortrows

  • 要制作一个具有唯一和排序行时间的时间表,请使用独特的调整时间

  • 若要删除重复的时间,请指定一个具有唯一时间的向量并使用调整时间

  • 要制定有规律的时间表,请指定有规律的时间矢量和使用调整时间

负载的时间表

从mat -文件加载一个时间表示例badTimes其中包含了2016年6月9日几个小时的天气测量数据。的时间表TT包括温度,降雨量和风速的测量在那天不定期的时间。

负载badTimesTT
TT =12×3的时间表时间临时雨风速  ____________________ ____ ____ _________ 09 - 73年6月- 2016年06:01:04 0.01 - 2.3 09年6月- 2016 07:59:23 59 0.08 - 0.9 09年6月- 2016年09:53:57 59 0.03 - 3.4 09 - 67年6月- 2016年09:53:57 0.03 - 3.4 NaT 56 0 0 09 - 67年6月- 2016年09:53:57 0.03 - 3.4 09 - 62年6月- 2016年08:49:10 0.01 - 2.7 09年6月- 2016年08:49:10 75.8 0.01 2.7 09 - 82年6月- 2016年08:49:10 0.01 - 2.709-Jun-2016 05:03:11 66.2 0.05 3 09-Jun-2016 08:49:10 67.2 0.01 2.7 09-Jun-2016 04:12:00 58.8

查找和删除缺少行时间的行

一种开始的方法是查找和删除具有NaT,或缺少的值,如行时间。要查找行乘以向量中缺失的值,请使用ismissing.的ismissing函数返回包含1无论TT。时间缺少一个值。

natRowTimes = ismissing (TT.Time)
natRowTimes =12 x1逻辑阵列0 0 0 1 1 0 0 0 0⋮

为了只保留那些没有缺失值的行作为行时间,索引到TT使用~ natRowTimes行指标。给这些行分配一个新的时间表,goodRowTimesTT

goodRowTimesTT = TT (~ natRowTimes,:)
goodRowTimesTT =11×3的时间表时间临时雨风速  ____________________ ____ ____ _________ 09 - 73年6月- 2016年06:01:04 0.01 - 2.3 09年6月- 2016年07:59:23 59 0.08 - 0.9 09 - 2016年6月——09:53:57 59 0.03 - 3.4 09 - 67年6月- 2016年09:53:57 0.03 0.03 - 3.4 3.4 09 - 67年6月- 2016年09:53:57 09 - 62年6月- 2016年08:49:10 0.01 - 2.7 09年6月- 2016年08:49:10 75.8 0.01 2.7 09 - 82年6月- 2016年08:49:10 0.01 - 2.7 09 - jun - 201605:03:11 66.2 0.05 3 09-Jun-2016 08:49:10 67.2 0.01 2.7 09-Jun-2016 04:12:00 58.8

此方法只删除缺少行时间的行。时间表变量仍然可能有丢失的数据值。例如,的最后一行goodRowTimesTT的值风速变量。

删除缺少时间和数据的行

作为一种替代方法,您可以使用rmmissing函数。rmmissing删除任何缺少行时间、缺少数据值或两者兼有的时间表行。

显示缺失的行时间和缺失的数据值TT

TT
TT =12×3的时间表时间临时雨风速  ____________________ ____ ____ _________ 09 - 73年6月- 2016年06:01:04 0.01 - 2.3 09年6月- 2016 07:59:23 59 0.08 - 0.9 09年6月- 2016年09:53:57 59 0.03 - 3.4 09 - 67年6月- 2016年09:53:57 0.03 - 3.4 NaT 56 0 0 09 - 67年6月- 2016年09:53:57 0.03 - 3.4 09 - 62年6月- 2016年08:49:10 0.01 - 2.7 09年6月- 2016年08:49:10 75.8 0.01 2.7 09 - 82年6月- 2016年08:49:10 0.01 - 2.709-Jun-2016 05:03:11 66.2 0.05 3 09-Jun-2016 08:49:10 67.2 0.01 2.7 09-Jun-2016 04:12:00 58.8

删除所有缺少行时间或数据值的行。将剩下的行分配给时间表goodValuesTT

goodValuesTT = rmmissing (TT)
goodValuesTT =10×3的时间表时间临时雨风速  ____________________ ____ ____ _________ 09 - 73年6月- 2016年06:01:04 0.01 - 2.3 09年6月- 2016年07:59:23 59 0.08 - 0.9 09 - 2016年6月——09:53:57 59 0.03 - 3.4 09 - 67年6月- 2016年09:53:57 0.03 0.03 - 3.4 3.4 09 - 67年6月- 2016年09:53:57 09 - 62年6月- 2016年08:49:10 0.01 - 2.7 09年6月- 2016年08:49:10 75.8 0.01 2.7 09 - 82年6月- 2016年08:49:10 0.01 - 2.7 09 - jun - 201605:03:11 66.2 0.05 3 09-Jun-2016 08:49:10 67.2 0.01 2.7

排序时间表并确定它是否是常规的

处理完缺失值后,您可以继续对您的时间表进行排序,然后确定排序后的时间表是否有规律。

来确定goodValuesTT已经排序,使用issorted函数。

tf = issorted (goodValuesTT)
tf =逻辑0

由于它不是,使用sortrows函数。

sortedTT = sortrows (goodValuesTT)
sortedTT =10×3的时间表时间临时雨风速  ____________________ ____ ____ _________ 09 - 2016年6月——05:03:11 66.2 - 0.05 3 09 - 73年6月- 2016年06:01:04 0.01 - 2.3 09年6月- 2016年07:59:23 59 0.08 - 0.9 09 - 62年6月- 2016年08:49:10 0.01 - 2.7 09年6月- 2016年08:49:10 75.8 0.01 2.7 09 - 82年6月- 2016年08:49:10 0.01 - 2.7 09年6月- 2016年08:49:10 67.2 0.01 2.7 09 - 2016年6月——09:53:57 59 0.03 - 3.4 09 - jun - 201609- june -2016 09:53:57 67 0.03 3.4

确定是否sortedTT是常规的。一个固定的时间表在连续的行时间之间有相同的时间间隔。即使是一个有序的时间表也可能有不统一的时间步骤。

tf = isregular (sortedTT)
tf =逻辑0

因为它不是,显示行时间之间的差异。

diff (sortedTT.Time)
ans =9 x1持续时间00:57:53 00:58:19 00:49:47 00:00:00 00:00:00 00:00:00

由于行时间是排序的,这个结果表明,有些行时间是唯一的,有些是重复的。

删除重复的行

时间表可以有重复的行。如果时间表行具有相同的行时间和相同的数据值,则它们是副本。在本例中,的最后两行sortedTT重复的行。(还有其他几行sortedTT具有重复的行时间但不同的数据值。)

从中删除重复的行sortedTT,使用独特的.的独特的函数返回唯一的行,并按行时间对它们进行排序。

uniqueRowsTT =独特(sortedTT)
uniqueRowsTT =9×3的时间表时间临时雨风速  ____________________ ____ ____ _________ 09 - 2016年6月——05:03:11 66.2 - 0.05 3 09 - 73年6月- 2016年06:01:04 0.01 - 2.3 09年6月- 2016年07:59:23 59 0.08 - 0.9 09 - 62年6月- 2016年08:49:10 0.01 - 2.7 09年6月- 2016年08:49:10 67.2 0.01 2.7 09 - 2016年6月——08:49:10 75.8 0.01 2.7 09 - 82年6月- 2016年08:49:10 0.01 - 2.7 09年6月- 2016 09:53:57 59 0.03 - 3.4 09年6月- 201609:53:57 67 0.03 3.4

查找具有重复时间和不同数据的行

时间表可以有具有重复行时间但数据值不同的行。在这个例子中,uniqueRowsTT具有具有相同行时间但不同值的几行。

查找具有重复行时间的行。首先,对行时间进行排序,并找出连续的没有差异的行时间。它们之间没有区别的时间是重复的。将索引返回到行时间向量中,并返回唯一的时间集合,该集合标识重复的行时间uniqueRowsTT

dupTimes = (uniqueRowsTT.Time)进行排序;tf = (diff(dupTimes) == 0);dupTimes = dupTimes (tf);dupTimes =独特(dupTimes)
dupTimes =2 x1 datetime09-Jun-2016 08:49:10 09-Jun-2016 09:53:57

若要显示具有重复行时间的行,请索引intouniqueRowsTT使用dupTimes.当按时间建立索引时,输出时间表将包含具有匹配行时间的所有行。

uniqueRowsTT (dupTimes:)
ans =6×3的时间表时间温度雨风速____________________ _________________ 09-Jun-2016 08:49:10 62 0.01 2.7 09-Jun-2016 08:49:10 67.2 0.01 2.7 09-Jun-2016 08:49:10 75.8 0.01 2.7 09-Jun-2016 08:49:10 82 0.01 2.7 09-Jun-2016 09:53:57 59 0.03 3.4 09-Jun-2016 09:53:57 67 0.03 3.4

选择具有重复次数的第一行和最后一行

当时间表有重复时间的行时,您可能希望选择特定的行,并丢弃其他具有重复时间的行。例如,可以使用独特的调整时间功能。

首先,创建一个唯一行时间的向量TT通过使用独特的

uniqueTimes =独特(uniqueRowsTT.Time)
uniqueTimes =5 x1 datetime09-Jun-2016 05:03:11 09-Jun-2016 06:01:04 09-Jun-2016 07:59:23 09-Jun-2016 08:49:10 09-Jun-2016 09:53:57

从每一组具有重复时间的行中选择第一行。要从第一行复制数据,请指定“firstvalue”方法。

firstUniqueRowsTT =调整时间(uniqueRowsTT uniqueTimes,“firstvalue”
firstUniqueRowsTT =5×3的时间表时间温度雨风速____________________ _________________ 09-Jun-2016 05:03:11 66.2 0.05 3 09-Jun-2016 06:01:04 73 0.01 2.3 09-Jun-2016 07:59:23 59 0.08 0.9 09-Jun-2016 08:49:10 62 0.01 2.7 09-Jun-2016 09:53:57 59 0.03 3.4

从每一组具有重复时间的行中选择最后一行。要从最后一行复制数据,请指定“lastvalue”方法。

lastUniqueRowsTT =调整时间(uniqueRowsTT uniqueTimes,“lastvalue”
lastUniqueRowsTT =5×3的时间表时间温度雨风速____________________ _________________ 09-Jun-2016 05:03:11 66.2 0.05 3 09-Jun-2016 06:01:04 73 0.01 2.3 09-Jun-2016 07:59:23 59 0.08 0.9 09-Jun-2016 08:49:10 82 0.01 2.7 09-Jun-2016 09:53:57 67 0.03 3.4

因此,最后两行firstUniqueRowsTTlastUniqueRowsTT有不同的值临时变量。

从重复次数的所有行聚合数据

处理具有重复时间的行中的数据的另一种方法是以某种方式聚合或组合数据值。例如,您可以计算在同一时间对相同数量的几个测量的平均值。

方法计算具有重复行次数的行的平均温度、降雨量和风速调整时间函数。

meanTT =调整时间(uniqueRowsTT uniqueTimes,“的意思是”
meanTT =5×3的时间表时间温度雨风速____________________ __________________ 09-Jun-2016 05:03:11 66.2 0.05 3 09-Jun-2016 06:01:04 73 0.01 2.3 09-Jun-2016 07:59:23 59 0.08 0.9 09-Jun-2016 08:49:10 71.75 0.01 2.7 09-Jun-2016 09:53:57 63 0.03 3.4

因此,最后两行meanTT有平均温度临时变量表示具有重复行时间的行。

使时间表定期

最后,您可以重新抽样数据从一个不规则的时间表,使它有规律地使用调整时间函数。例如,您可以插入数据meanTT到一个固定的每小时时间向量上。要使用线性插值,请指定“线性”.每一行时间hourlyTT从小时开始,连续行时间之间有一个小时的间隔。

hourlyTT =调整时间(meanTT,“每小时”,“线性”
hourlyTT =6×3的时间表时间温度雨风速____________________ ______________ _________ 09-Jun-2016 05:00:00 65.826 0.0522 3.085 09-Jun-2016 06:00:00 72.875 0.010737 2.3129 09-Jun-2016 07:00:00 66.027 0.044867 1.6027 09-Jun-2016 08:00:00 59.158 0.079133 0.9223 09-Jun-2016 09:00:00 70.287 0.013344 2.8171 09-Jun-2016 10:00:00 62.183 0.031868 3.4654

而不是使用预定义的时间步长,例如“每小时”,您可以指定自己的时间步长。要指定30分钟的时间步长,请使用“普通”输入参数和“步伐”名称-值参数。可以将任意大小的时间步长指定为持续时间calendarDuration价值。

regularTT =调整时间(meanTT,“普通”,“线性”,“步伐”分钟(30))
regularTT =11×3的时间表时间温度雨风速____________________ ______________ _________ 09-Jun-2016 05:00:00 65.826 0.0522 3.085 09-Jun-2016 05:30:00 69.35 0.031468 2.6757 09-Jun-2016 06:00:00 72.875 0.010737 2.3129 09-Jun-2016 06:30:00 69.576 0.027118 1.9576 09-Jun-2016 07:00:00 66.027 0.044867 1.6027 09-Jun-2016 07:30:00 62.477 0.062616 1.2477 09-Jun-201608:00:00 59.158 0.079133 0.9223 09- june -2016 08:30:00 66.841 0.03695 2.007 09- june -2016 09:00:00 70.287 0.013344 2.8171

将常规时间表数据提取到数组中

您可以导出时间表数据,以便与相关功能一起分析时间间隔有规律的数据。例如,Econometrics工具箱™和信号处理工具箱™具有一些功能,您可以使用它们对定期间隔的数据进行进一步分析。

以数组形式提取时间表数据。你可以使用变量属性以返回数组形式的数据,只要表变量具有允许连接它们的数据类型。

一个= regularTT。变量
一个=11×30.0315 2.6757 72.8747 0.0107 2.3129 69.5764 0.0271 66.0266 0.0449 1.6027 62.4768 0.0626 1.2477 59.1579 0.0791 0.9223 66.8412 0.0370 2.0070 70.2868 0.0133 2.8171 66.2348 0.0226 3.1412⋮

regularTT。变量等价于使用花括号语法,regularTT {:,:},以访问时间表变量中的数据。

A2 = regularTT {:,:}
A2 =11×30.0315 2.6757 72.8747 0.0107 2.3129 69.5764 0.0271 66.0266 0.0449 1.6027 62.4768 0.0626 1.2477 59.1579 0.0791 0.9223 66.8412 0.0370 2.0070 70.2868 0.0133 2.8171 66.2348 0.0226 3.1412⋮

另请参阅

|||||||||

相关的话题