Case study nierziekte II: Feature Union

Nu je numerieke en categorische kolommen apart hebt geïmputeerd, is het jouw taak om met scikit-learn's FeatureUnion hun resultaten samen te voegen. Die zitten in twee afzonderlijke transformerobjecten: numeric_imputation_mapper en categorical_imputation_mapper.

Je hebt FeatureUnion misschien al gezien in Machine Learning with the Experts: School Budgets. Net als bij pipelines geef je een lijst van (string, transformer)-tuples door, waarbij de eerste helft van elke tuple de naam van de transformer is.

Deze oefening maakt deel uit van de cursus

Extreme Gradient Boosting met XGBoost

Bekijk cursus

Oefeninstructies

Importeer FeatureUnion uit sklearn.pipeline.
Combineer de resultaten van numeric_imputation_mapper en categorical_imputation_mapper met FeatureUnion(), met respectievelijk de namen "num_mapper" en "cat_mapper".

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Import FeatureUnion
from sklearn.pipeline import FeatureUnion

# Combine the numeric and categorical transformations
numeric_categorical_union = ____([
                                          ("____", ____),
                                          ("____", ____)
                                         ])

Code bewerken en uitvoeren