如果我必须构建一个时间序列预测模型,而我所拥有的只是用户登录网站时的时间戳序列,您如何建模?
下面是数据的前几行。我把它当作熊猫系列。
0 2012-03-01 00:05:55
1 2012-03-01 00:06:23
2 2012-03-01 00:06:52
3 2012-03-01 00:11:23
4 2012-03-01 00:12:47
5 2012-03-01 00:12:54
6 2012-03-01 00:16:14
7 2012-03-01 00:17:31
8 2012-03-01 00:21:23
9 2012-03-01 00:21:26
现在有几个问题:
1). 当我只有时间戳而没有 Y 值或任何其他功能时,如何每小时绘制用户行为图
2). 建立一个适合这个时间序列的模型,并预测未来两周。
没有给出其他特征或变量。每天只需登录3个月。
作为对第 1 部分的回应。 我做过类似的事情并遇到了同样的问题。 我使用纪元对时间序列进行分组,并将其加载到字典中。 从那里,我可以以小时为单位处理时间序列。 (数据来源为 JSON) 然后,您可以直接使用matplotlib将其转换为熊猫数据帧和图表。 由于您的数据已经在 panda 中,因此您可以跳过数据拉取并编辑初始循环来处理原始数据。 我希望这有所帮助。
for key in responseJson['All'].keys():
t = time.strftime('%Y,%m,%d %H:00:00', time.gmtime(float(key) / 1000.0))
h = responseJson['All'][key]
word = t
epochkey = int(time.mktime(time.strptime(t, '%Y,%m,%d %H:00:00')))
if word not in dict:
dict[word] = h
epochdict[epochkey] = h
else:
dict[word] += h
epochdict[epochkey] += h
然后我把它转换成熊猫数据帧:
for row in epochdict:
if(row[0] not in data):
data[row[0]]={}
data[str(row[0])][str(row[2])]=round(row[3],3)
df=DataFrame(data).T.fillna(0)
这允许我根据时间序列绘制每小时数据。