选择要从excel读取到pandas数据帧中的行号



我有一个共享的电子表格,每天都会添加行。我正在创建一个脚本,该脚本将电子表格读取到数据帧pd.read_excel(infile, sheet_name=0)中,并使用df.drop_duplicates(keep='first')检查重复的行。该脚本将是一个安装在多个人计算机上的包,供他们随时使用,不同的人会想要检查不同的行。有没有办法让想要使用脚本的人选择他们想要检查的行的范围?例如,如果电子表格有100行,并且有人想检查40-60行中的重复行,有可能这样做吗?

您可以接受行边界的用户输入,然后将它们传递给iloc:

import pandas as pd
start = int(input('Enter your starting row: '))
stop = int(input('Enter your ending row: '))
df_limited = df.iloc[start:stop].drop_duplicates(keep='first')

最新更新