我在分组数据和绘制随时间变化的图以显示增量变化时遇到了一个问题。数据结构在下面的传入数据中,并添加到pandas数据框架中:
"DateTime","Classification","Confidence"
我想做的是显示分类的唯一值,并计算它们每5分钟出现多少次。然后我想将其绘制成每5分钟更新一次的图,显示随时间的增量值。
我试过不同的方法,但我就是不明白。我可以得到的数据帧是:
我找到了一个方法。也许不是python的方式:
def CreateStats():
print("Reading from file")
aggDict = {}
fo = open("/home/user/Temp/test_data.txt", "r")
for t in range(20):
fo.seek(0, 0)
aggDict[t] = defaultdict(int)
for line in fo:
#print(str(datetime.now())+" - " + line)
defect = line.split(";")
aggDict[t][defect[0]] += 1
if t > 0:
for key in aggDict[t]:
aggDict[t][key] += aggDict[t-1][key]
print(aggDict)
df = pd.DataFrame(aggDict)
df2 = df.transpose()
lines = df2.plot.line()
plt.show()
{
0: defaultdict (& lt;类"int"祝辞,{"泡沫":2,"兔子":2,"杯":1}),
1: defaultdict (& lt;类"int"祝辞,{"兔子":"泡沫":12日10日"杯":2}),
2: defaultdict (& lt;类"int"祝辞,{"泡沫":62年,"兔子":42岁,"杯":3})
}
所使用的文件包含一个2列分号;类型和值的分隔列表。不使用此代码中的值…