我读过很多很多类似的答案,但遗憾的是,所有的解决方案都没有结果。
我正在使用Glob从文件夹导入许多CSV文件,并希望将它们合并到一个Pandas Dataframe中。然而,在我目前的解决方案中,虽然列是完美的,但许多重复的行(根据玩家名称和;团队)存在。
我现在的代码如下:
# Imports
import pandas as pd
from glob import glob
# Concat Code
df = pd.concat(map(pd.read_csv, sorted(glob(f"{Year}*.csv"), key=len)), join='outer', ignore_index=True, axis=0)
我当前的输出是:
球队 | 第一轮 | 第二轮 | 甲 | 团队 | 100 | 南 |
---|---|---|---|
玩家B | 团队B | 200 | 南 |
球员C | 团队 | 南 | 南 |
团队 | 南 | 110 | |
玩家B | 团队B | 南 | 210 |
球员C | 团队 | 南 | 南 |
这可能不是最好的答案,但如果NaN总是数值,为什么不将它们替换为"0"那么grouBy agg应该可以。像这样:df['DataFrame Column'].fillna(0)