Python替换与字符串相等的数据框值



我试图隔离目录中最新的文件,并将数据框架中来自该文件的任何行标记为"最新的"。

基本上,我要让我的源栏显示为"pipeline-03-01-2020.xlsx", "pipeline-01-01-2020.xlsx", "pipeline-01-01-2020.xlsx",我正在寻找一行代码来突出显示"pipeline-03-01-2020.xlsx"=最新的文件,并替换Source列中的值:" pipel-03-01-2020 .xlsx"——比;"这Week"其余的保持不变……下面这条线有什么问题?

list_of_files = glob.glob(link_pipe2) # * means all if need specific format then *.csv
latest_file = max(list_of_files, key=os.path.getctime)
pipeline['Source'] = pipeline['Source'].apply(lambda x: 'This Week' if latest_file in x else pipeline['Source'])
mask = pipeline['Source'] == latest_fname
pipeline[mask]['Source'] = "This Week"

是我处理这个

的方式

你可以在你的源列上使用.replace来完成这项工作。

管道("源")。replace(to_replace=latest_file, value='This Week', inplace=True)

相关内容

最新更新