熊猫,记录了一个连续的平均值



我正在编写一个程序,接收与时间相关的数据,如果每分钟有多个数据点,我希望能够对数据值进行平均。数据点也有不同的设备,它们记录数据,不能混合。我使用的是pandas数据帧,输入的数据点几乎永远不会持续用于同一列,所以如果我想让它快速运行,我就不能在输入时添加它们,然后用存储的计数器对它们进行平均。关于如何在我走的时候记录平均值,有什么想法吗?

def add_data(self, x, whitelist, time_zone):
y, mo, d, h, mi, s = self.parseDateTime(x['date'])   
date = (dt.datetime(y, mo, d, h, mi) + dt.timedelta(hours=self.time_zones[self.time_zone])).strftime("%m/%d/%Y %I:%M %p")
key = x['keys']
val = x['val']
if (val != 'NaN'):
if(key in whitelist):
self.dfOut[key][date] = val 

您可能需要先清理数据,如果数据准备好进行分析,可能会创建一个新列,然后包括一些逻辑来比较数据在算法中应该计算平均值还是不计算平均值,您是否可以共享数据样本和您可能拥有的任何算法。

最新更新