Case study nierziekte II: Feature Union
Nu je numerieke en categorische kolommen apart hebt geïmputeerd, is het jouw taak om met scikit-learn's FeatureUnion hun resultaten samen te voegen. Die zitten in twee afzonderlijke transformerobjecten: numeric_imputation_mapper en categorical_imputation_mapper.
Je hebt FeatureUnion misschien al gezien in Machine Learning with the Experts: School Budgets. Net als bij pipelines geef je een lijst van (string, transformer)-tuples door, waarbij de eerste helft van elke tuple de naam van de transformer is.
Deze oefening maakt deel uit van de cursus
Extreme Gradient Boosting met XGBoost
Oefeninstructies
- Importeer
FeatureUnionuitsklearn.pipeline. - Combineer de resultaten van
numeric_imputation_mapperencategorical_imputation_mappermetFeatureUnion(), met respectievelijk de namen"num_mapper"en"cat_mapper".
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Import FeatureUnion
from sklearn.pipeline import FeatureUnion
# Combine the numeric and categorical transformations
numeric_categorical_union = ____([
("____", ____),
("____", ____)
])