parse_dates不能将字符串转换为日期时间

我尝试从链接https://raw.githubusercontent.com/LinkedInLearning/data_cleaning_python_2883183/main/Ch04/challenge/traffic.csv读取CSV

df = pd.read_csv('https://raw.githubusercontent.com/LinkedInLearning/data_cleaning_python_2883183/main/Ch04/challenge/traffic.csv', parse_dates=['time'])

但是，时间列仍然是字符串格式

df.dtypes 
[output]
ip        object
time      object
path      object
status     int64
size       int64
dtype: object

有趣的是，当我从不同的url读取类似的csv时，它工作了。所以

df = pd.read_csv('https://raw.githubusercontent.com/LinkedInLearning/data_cleaning_python_2883183/main/Ch04/solution/traffic.csv', parse_dates=['time'])

确实将时间列转换为datetime对象。为什么parse_dates在第一个链接中失败，我如何修复它?

datetimes:

1017-06-19 14:46:24

可能的解决方案是将值转换为NaT:

df['time'] = pd.to_datetime(df['time'], errors='coerce')

相关内容

最新更新

热门标签：