我有一个呼叫中心代理的数据集,我想计算每个代理处理时间的平均值。
我有呼叫持续时间,但我试图将其转换为DateTime我有一个错误TypeError: to_timedelta() got an unexpected keyword argument 'format'
和sys
df['Interaction_Duration']
294 24:53
295 25:15
296 27:02
297 33:44
298 35:52
df['Interaction_Duration'] = pd.to_timedelta(df['Interaction_Duration'],format='%M:%S')
结果是
TypeError Traceback (most recent call last)
<ipython-input-160-350e60e01ab7> in <module>
----> 1 df['Interaction_Duration'] = pd.to_timedelta(df['Interaction_Duration'],format='%M:%S')
TypeError: to_timedelta() got an unexpected keyword argument 'format'
df['Interaction_Duration']
df['Interaction_Duration'] = pd.to_timedelta(df['Interaction_Duration'],format='%M:%S')
我为呼叫中心代理设置了数据集,我想计算每个代理处理时间的平均值。我有呼叫持续时间,但我试图将其转换为DateTime。我有一个错误(TypeError:to_timedelta((得到了一个意外的关键字参数"format"(和sys
区块报价df['Interaction_Duration']294 24:53 295 25:15 296 27:02 297 33:44 298 35:52
在此处输入代码df[‘Interaction_Duration’]=pd.to_timedelta(df[‘Interaction_Duration’],格式=‘%M:%S’(
结果是TypeError Traceback(上一次调用的最近一次(在---->1 df[‘Interaction_Duration’]=pd.to_timedelta(df[‘Interaction_Duration’],格式=‘%M:%S’(
TypeError:to_timedelta((获得了意外的关键字参数"format">
我相信您要做的是计算由ID定义的代理在服务调用上平均花费的平均时间
给定由以下人员定义的数据帧:
import pandas as pd
dtin = [[294, '24:53'],
[295, '25:15'],
[296, '27:02'],
[297, '33:44'],
[298, '35:52'],
[294, '18:33'],
[295, '16:25'],
[296, '11:02'],
[297, '20:44'],
[298, '19:52'],
[294, '34:53'],
[295, '35:15'],
[296, '37:02'],
[297, '43:44'],
[298, '45:52']
]
df = pd.DataFrame(data=dtin, columns = ['ID', 'Time'])
步骤1:通过将"时间"列转换为日期时间
df['Time'] = pd.to_datetime(df["Time"], format='%M:%S')
步骤2:添加新列,该列通过以最小持续时间表示时间
df['T_dur'] = [x.minute + x.second/60 for x in df['Time'].to_list()]
步骤3:按ID分组数据依据:
gb = df.groupby("ID")
步骤4通过计算每个代理的平均T_dur
gb['T_dur'].mean()
产生:
ID
294 26.105556
295 25.638889
296 25.033333
297 32.733333
298 33.866667
Name: T_dur, dtype: float64