我有一个df,它有两列*总空闲时间和月,如下所示:
Total Idle Time Month
0 0:00:00 December
1 0:02:24 December
2 26:00:00 December
3 0:53:05 December
4 28:03:39 December
这里的总空闲时间列是字符串格式的,但我想将其转换为时间格式,因为我想添加12月份的总空闲时间。
我尝试将该列转换为日期时间,如下所示:
data['Total Idle Time '] = pd.to_datetime(data['Total Idle Time '], format='%H:%M:%S')
然而,我得到了一个错误如下:
time data '28:03:39' does not match format '%H:%M:%S' (match)
我曾想过将列转换为int,并根据小时和分钟将其相加,但我没有成功。有什么方法可以做到这一点吗?
您可以在此处尝试使用pd.to_timedelta()
:
>>> df['Idle Time'] = pd.to_timedelta(df["Idle Time"])
>>> df
Total Idle_Time Month
0 0 0 days 00:00:00 December
1 1 0 days 00:02:24 December
2 2 1 days 02:00:00 December
3 3 0 days 00:53:05 December
4 4 1 days 04:03:39 December
如果需要,可以通过缩放.total_seconds()
:的结果将其转换为数字
# in hours
>>> df['Idle Time'] = df['Idle Time'].dt.total_seconds() / 3600
>>> df
Total Idle_Time Month
0 0 0.000000 December
1 1 0.040000 December
2 2 26.000000 December
3 3 0.884722 December
4 4 28.060833 December