Python,Pandas将柱分为两个



我有一个带有多个列的数据框,其中之一是日期列。当前,该列中的数据处于此形式:02/01/2012 9:30

但是,我想将其分成两个单独的列,日期:02/01/2012和时间:9:30

我找到了以下解决方案:

df = pd.DataFrame(df.date.str.split(' ',1).tolist(), columns = ['date','time'])

但是,这创建了一个新的数据框架,该框架仅包含两个新的拆分列,而不包含其他截面列。

有没有办法将现有数据框架的一列分开而不创建新的框架?

解决此问题的最有效方法是什么?(我正在使用的数据集包含约20亿行(

尝试以下:

df[['date','time']] = df.pop('date').str.split(expand=True)

演示

In [274]: df
Out[274]:
              date
0  02/01/2012 9:30
1  02/01/2012 9:30
2  02/01/2012 9:30
In [275]: df[['date','time']] = df.pop('date').str.split(expand=True)
In [276]: df
Out[276]:
         date  time
0  02/01/2012  9:30
1  02/01/2012  9:30
2  02/01/2012  9:30

如果您的date列是字符串,而您只想将它们分开...那么这应该有效

date_time = df.date.str.split(expand=True).rename(columns={0: 'date', 1: 'time'})
df = df.drop('date', 1).join(date_time)
print(df)
   A  B        date  time
0  1  2  02/01/2012  9:30

设置
假设数据框df

df = pd.DataFrame(dict(date=['02/01/2012 9:30'], A=[1], B=[2]))
print(df)
   A  B             date
0  1  2  02/01/2012 9:30

但是,假设您的date列实际上是DateTimes

df = pd.DataFrame(dict(date=pd.to_datetime(['02/01/2012 9:30']), A=[1], B=[2]))
print(df)
   A  B                date
0  1  2 2012-02-01 09:30:00

然后我们

df = df.assign(date=df.date.dt.date, time=df.date.dt.time)
print(df)
   A  B                date
0  1  2 2012-02-01 09:30:00

最新更新