使用熊猫在 Python 中导入分号分隔.txt文件

我正在尝试使用pandas在Python中导入一个分号分隔的巨大.txt文件。该文件没有固定的列长度。这不允许我正确导入数据。我尝试了以下方法，但似乎这也不起作用。有人可以建议一种简单的替代方法来克服它吗？

#import libraries
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
#Loading the .txt file
#dataset = pd.read_table('a.txt' , sep = ';' , header=None)
df = pd.DataFrame()
with open('a.txt', 'r') as f:
    for line in f:
        df = pd.concat( [df, pd.DataFrame([tuple(line.strip().split(';'))])], ignore_index=True )

这可能

对你有用。没有数据示例，就无法测试...

#import libraries
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
#Loading the .txt file
df = pd.read_csv('a.txt' , sep=';' , header=None)

您的数据不是表格，不适合 pandas 数据帧。例如，前两行是：

Breakfast & Brunch;American (Traditional);Restaurants
Sandwiches;Restaurants

其中一个有三个字段，另一个有两个字段。 pandas 数据帧专为表格数据而设计，其中每行具有相同的列数，并且每列具有相同的行数。

相关内容

最新更新

热门标签：