Fallstudie Nierenerkrankung II: Feature Union
Nachdem du numerische und kategoriale Spalten getrennt imputiert hast, sollst du jetzt scikit-learns FeatureUnion verwenden, um ihre Ergebnisse zu verketten. Diese liegen in zwei separaten Transformer-Objekten vor – numeric_imputation_mapper und categorical_imputation_mapper.
Vielleicht bist du FeatureUnion bereits in Machine Learning with the Experts: School Budgets begegnet. Genau wie bei Pipelines übergibst du eine Liste von (string, transformer)-Tupeln, wobei die erste Hälfte jedes Tupels der Name des Transformers ist.
Diese Übung ist Teil des Kurses
Extreme Gradient Boosting mit XGBoost
Anleitung zur Übung
- Importiere
FeatureUnionaussklearn.pipeline. - Kombiniere die Ergebnisse von
numeric_imputation_mapperundcategorical_imputation_mappermitFeatureUnion(), und verwende dafür die Namen"num_mapper"bzw."cat_mapper".
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Import FeatureUnion
from sklearn.pipeline import FeatureUnion
# Combine the numeric and categorical transformations
numeric_categorical_union = ____([
("____", ____),
("____", ____)
])