仅在特定列上使用功能工具



我正在尝试使用特征工具仅使用泰坦尼克号数据集的一些指定列来生成一些新特征。就我而言,我想对年龄、Pclass 和 log10splitfare进行转换"add_numeric"和"multiply_numeric"。据我所知,我已经遵循了这里给出的语法,但无济于事。下面的代码不会出错,但它不会产生任何其他列。我还使用这个堆栈溢出链接作为参考。

es = ft.EntitySet(id = 'Titanic')
es.entity_from_dataframe(entity_id = 'data', dataframe = ftdataset_cleaned, 
make_index = False, index = 'index')
# Run deep feature synthesis with transformation primitives
feature_matrix, feature_defs = ft.dfs(entityset = es, target_entity = 'data',
trans_primitives = ['add_numeric', 'multiply_numeric'],
primitive_options= {('add_numeric', 'multiply_numeric'):{"include_entities": ['Age','PClass','log10SplitFare']}}
)

可以使用include_variables选项指定实体中要用于特定基元的哪些列

feature_matrix, feature_defs = ft.dfs(
entityset=es,
target_entity='data',
trans_primitives=['add_numeric', 'multiply_numeric'],
primitive_options={
('add_numeric', 'multiply_numeric'): {
'include_variables': {'data': ['Age', 'PClass', 'log10SplitFare']}}})

本指南更深入地介绍了控制基元应用方式的不同方法。

最新更新