我正在尝试从Python中的Excel数据读取和过滤。我使用以下代码:
import pandas as pd
import numpy as np
df = pd.read_excel('file.xlsx')
df['apples'] = (pd.cut(df['apples'],bins=[-np.inf,2,5,np.inf],labels=['WOW','ok','BOB']))
print(df)
这是我的excel文件
但是KeyError:"苹果"发生。您对如何解决此问题有任何建议吗?
您的问题是您的标题带有2
行,因此默认情况下DataFrame
的列是由第一行创建的。
因此,需要以下第一行跳过以下第一行
df = pd.read_excel('file.xlsx', skiprows=1)
或:
df = pd.read_excel('file.xlsx', header=1)
您还想修改XLSX文件吗?或者您只想阅读它并将一些代码应用到它?在第二种情况下,您可以这样做:
df = df.drop(['apples'])
您可以输入:
inputX = df.loc[:, ['oranges', 'lemons']].as_matrix()
这取决于您想处理什么。