python pandas pd.to_datetime



我有一个呼叫中心代理的数据集,我想计算每个代理处理时间的平均值。

我有呼叫持续时间,但我试图将其转换为DateTime我有一个错误TypeError: to_timedelta() got an unexpected keyword argument 'format'

和sys

df['Interaction_Duration']
294    24:53
295    25:15
296    27:02
297    33:44
298    35:52
df['Interaction_Duration'] = pd.to_timedelta(df['Interaction_Duration'],format='%M:%S')

结果是

TypeError                                 Traceback (most recent call last)
<ipython-input-160-350e60e01ab7> in <module>
----> 1 df['Interaction_Duration'] = pd.to_timedelta(df['Interaction_Duration'],format='%M:%S')
TypeError: to_timedelta() got an unexpected keyword argument 'format'
df['Interaction_Duration']

df['Interaction_Duration'] = pd.to_timedelta(df['Interaction_Duration'],format='%M:%S')

我为呼叫中心代理设置了数据集,我想计算每个代理处理时间的平均值。我有呼叫持续时间,但我试图将其转换为DateTime。我有一个错误(TypeError:to_timedelta((得到了一个意外的关键字参数"format"(和sys

区块报价df['Interaction_Duration']294 24:53 295 25:15 296 27:02 297 33:44 298 35:52

在此处输入代码df[‘Interaction_Duration’]=pd.to_timedelta(df[‘Interaction_Duration’],格式=‘%M:%S’(

结果是TypeError Traceback(上一次调用的最近一次(在---->1 df[‘Interaction_Duration’]=pd.to_timedelta(df[‘Interaction_Duration’],格式=‘%M:%S’(

TypeError:to_timedelta((获得了意外的关键字参数"format">

我相信您要做的是计算由ID定义的代理在服务调用上平均花费的平均时间
给定由以下人员定义的数据帧:

import pandas as pd
dtin = [[294, '24:53'], 
[295, '25:15'], 
[296, '27:02'], 
[297, '33:44'], 
[298, '35:52'],
[294, '18:33'], 
[295, '16:25'], 
[296, '11:02'], 
[297, '20:44'], 
[298, '19:52'],
[294, '34:53'], 
[295, '35:15'], 
[296, '37:02'], 
[297, '43:44'], 
[298, '45:52']
]
df = pd.DataFrame(data=dtin, columns = ['ID', 'Time'])

步骤1:通过将"时间"列转换为日期时间

df['Time'] = pd.to_datetime(df["Time"], format='%M:%S') 

步骤2:添加新列,该列通过以最小持续时间表示时间

df['T_dur'] = [x.minute + x.second/60 for x in df['Time'].to_list()] 

步骤3:按ID分组数据依据:

gb = df.groupby("ID")  

步骤4通过计算每个代理的平均T_dur

gb['T_dur'].mean()  

产生:

ID
294    26.105556
295    25.638889
296    25.033333
297    32.733333
298    33.866667
Name: T_dur, dtype: float64

最新更新