使用熊猫在 Python 中导入分号分隔.txt文件



我正在尝试使用pandas在Python中导入一个分号分隔的巨大.txt文件。该文件没有固定的列长度。这不允许我正确导入数据。我尝试了以下方法,但似乎这也不起作用。有人可以建议一种简单的替代方法来克服它吗?

#import libraries
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
#Loading the .txt file
#dataset = pd.read_table('a.txt' , sep = ';' , header=None)
df = pd.DataFrame()
with open('a.txt', 'r') as f:
    for line in f:
        df = pd.concat( [df, pd.DataFrame([tuple(line.strip().split(';'))])], ignore_index=True )
这可能

对你有用。没有数据示例,就无法测试...

#import libraries
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
#Loading the .txt file
df = pd.read_csv('a.txt' , sep=';' , header=None)

您的数据不是表格,不适合 pandas 数据帧。 例如,前两行是:

Breakfast & Brunch;American (Traditional);Restaurants
Sandwiches;Restaurants

其中一个有三个字段,另一个有两个字段。 pandas 数据帧专为表格数据而设计,其中每行具有相同的列数,并且每列具有相同的行数。

最新更新