列之间具有不同间隔的滚动窗口矩阵



我有一个 21 年的数据向量,其中包含每日数据,并希望创建一个 365 天的滚动窗口,例如下一个周期在前一个月(30 天)之后的星星。 在问题中,n_interval定义了下一个窗口的第一个数据点与前一个序列的最后一个观测值之间的差异。

假设我的每日数据从 2000 年 1 月 1 日开始,那么第一列是 2000 年 1 月 1 日至 2001 年 1 月 1 日,第二列是从 2000 年 2 月 1 日开始。 并于 2001 年 2 月 1 日结束。 和...最后一列将涵盖 2017 年 1 月 1 日至 2018 年 1 月 1 日。 例如,如果:

vec = [1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17]

对于给定的变量n_interval = 3with window_size=5,输出矩阵应如下所示:

mat = [[1 4 7  10  13],
[2 5 8  11  14],
[3 6 9  12  15],
[4 7 10 13  16],
[5 8 11 14  17]]

给定您的示例向量

vec = [1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17];

我们可以通过以下方式创建一个索引方案:

首先,我们需要确定mat中将有多少行 .假设我们希望vec的每个元素至少用mat表示一次,那么我们需要确保最后一行的最后一个索引大于或等于vec的大小。很容易看出,mat中最后一列的索引由

last_index = n_interval*(n_rows-1) + n_columns

我们希望确保last_index >= numel(vec).将上述表达式代入不等式并求解n_rows得到

n_rows >= (numel(vec) - n_columns)/n_interval + 1

我们将n_rows指定为该边界的ceil,以便它是满足不等式的最小整数。现在我们知道了行数,我们为每个行生成起始索引列表

start_index = 1:n_interval:(n_interval*(n_rows-1)+1);

在索引矩阵中,我们希望每列为 1 加上前一列。换句话说,我们希望根据数组index_offset = 0:(n_interval-1)偏移列。

使用bsxfun我们通过计算start_indexindex_offset数组之间所有对的总和来生成索引矩阵

index = bsxfun(@plus, index_offset, start_index');

我们需要担心的最后一件事是越界。为了解决这个问题,我们应用mod函数来包装越界指示:

index_wrapped = mod(index-1, numel(vec))+1;

然后我们简单地根据index_wrapped对向量进行采样

mat = vec(index_wrapped);

完整的代码是

n_interval = 3;
n_columns = 5;
vec = 1:17;
n_rows = ceil((numel(vec)-n_columns)/n_interval + 1);
start_index = 1:n_interval:(n_interval*(n_rows-1)+1);
index_offset = 0:(n_columns-1);
index = bsxfun(@plus, index_offset, start_index');
index_wrapped = mod(index-1, numel(vec))+1;
mat = vec(index_wrapped);

相关内容

  • 没有找到相关文章

最新更新