我是Python编程的新手,正在努力使用pandas数据功能。我有熊猫数据框架设置如下
col1 col2 col3 col4
12:00 1 1 3 2
12:05 1 1 3 2
12:10 1 2 4 2
12:15 1 2 4 2
12:20 1 2 4 2
12:25 2 3 7 8
12:30 2 3 7 8
12:35 2 3 7 8
12:40 2 3 7 8
12:45 4 5 4 3
我想做的是提取(或擦除)行,当每列的数据改变
(第1,2行)(第3,4,5行)(第6,7,8,9行)(第10行)在不同的时间具有相同的值,因此结果如下所示。时间数据不能忽略
col1 col2 col3 col4
12:00 1 1 3 2
12:10 1 2 4 2
12:25 2 3 7 8
12:45 4 5 4 3
如果有任何特性或功能,这将是很大的帮助。谢谢你。
下面的代码将在您的查询中工作。
df = pd.DataFrame({
'Time': ['12:00','12:05','12:10','12:15','12:20','12:25','12:30','12:35','12:40','12:45'],
'Col1': ['1','1','1','1','1', '2', '2', '2', '2','4'],
'Col2': ['1','1', '2', '2', '2', '3','3','3','3','5'],
'Col3': ['3','3', '4', '4','4','7','7','7','7', '4'],
'Col4': ['2', '2', '2', '2','2', '8', '8', '8','8','3']
})
print(df)
print(df.drop_duplicates(subset=['Col2']))