使用python pandas操作excel



我有一个奇怪的excel格式excel格式的问题,我想把它们放在一个合适的格式与python熊猫,因为现在他们是按天分开的,它应该都像这个合适的格式。当我使用read_excel读取pandas时,我想统一它们并删除第一个title-date,从这个:

Unnamed: 1
NaN NaN
04Oct2020 (Sunday)  NaN
date & time         cars
04/10/2020 00:00:00 1
04/10/2020 00:01:00 2

将转换成合适的形式,例如:

date & time         cars
04/10/2020 00:00:00 1
04/10/2020 00:01:00 2
.
.
05/10/2020 00:00:00 1

(点表示日期是统一的)。我该怎么做呢?我没有成功,任何帮助都是感激的!

这是一种非常简单的方法,应该适用于您的数据集。

import pandas as pd
exclude = ["Mean", "STDEV", "Median", "Min", "Max", "date & time"]
df = pd.read_excel("test.xls", names = ["date_time", "cars"])
df = df[~df.date_time.isin(exclude)].dropna()
df.to_excel("testoutput.xls", index=False)

它将把这个输出写入一个新的Excel文件,删除行索引。

              date_time cars
1   2020-10-04 00:00:00    1
2   2020-10-04 00:01:00    2
3   2020-10-04 00:02:00    3
4   2020-10-04 00:03:00    4
5   2020-10-04 00:04:00    5
6   2020-10-04 00:05:00    6
7   2020-10-04 00:06:00    7
17  2020-10-05 00:00:00    1
18  2020-10-05 00:01:00    2
19  2020-10-05 00:02:00    3
20  2020-10-05 00:03:00    4
21  2020-10-05 00:04:00    5
22  2020-10-05 00:05:00    6
23  2020-10-05 00:06:00    7
24  2020-10-05 00:07:00    8
25  2020-10-05 00:08:00    9
26  2020-10-05 00:09:00   10

最新更新