是否可以从SelectfromeDel方法中输出选定的列名称



i在数据集中使用ExtratreesClassifier和Selectfromoskel执行了功能选择,但是我想在维护列名称的同时将这些选定的功能作为Dataframe将这些选定的功能作为DataFrame保存到CSV文件。请注意,输出为numpy数组返回重要功能整列而不是列标题

import pandas as pd
from sklearn.ensemble import ExtraTreesClassifier
from sklearn.feature_selection import SelectFromModel
import numpy as np

df = pd.read_csv('los_10_one_encoder.csv')
y = df['LOS'] # target 
X= df.drop('LOS',axis=1) # drop LOS column 
clf = ExtraTreesClassifier()
clf = clf.fit(X, y)
print clf.feature_importances_
model = SelectFromModel(clf, prefit=True)
X_new = model.transform(X)
model = SelectFromModel(clf, prefit=True)
feature_idx = model.get_support()
feature_name = df.columns[feature_idx]

使用方法DataFrame.to_csv()将数据框保存为csv文件。

执行以下操作:

X_new.to_csv("your/path", sep=';')

这是该方法文档的链接。

相关内容

  • 没有找到相关文章

最新更新