用熊猫设置标头



我有一些txt文件,它们以大量BS开头,在20至30行之后,有用的零件开始。我想在数字之前将最后一行用作标题。我知道如果我知道确切的行号,我可以将其设置为标题(使用pd.read_csv(,但是对于每个文件,该号码是不同的(正如我所说的那样,它在20到30之间(。我知道我正在寻找以"潜在"开头的界限。是否有任何简单的方法可以使用pd.read_csv并从头开始设置标头。

您可以使用"传统"文件I/O方法读取文件的顶部,并计数行,直到找到标头行为止。一旦知道其号码,请使用pandas.read_csv()重新阅读文件。

with open(yourfile) as infile:
    for n,row in enumerate(infile):
        if row.startswith("Potential"):
            break
df = pd.read_csv(yourfile, skiprows=n)

最新更新