Evalueer het UMAP-beslisboommodel
In de vorige oefening heb je een workflow gemaakt om UMAP toe te passen en een beslisboommodel te bouwen. Nu ga je het model fitten met die trainingsdata en de prestaties vergelijken met het ongereduceerde beslisboommodel. Omdat de doelvariabele credit_score categorisch is, gebruik je f_meas() om de prestaties van de modellen te evalueren. Het ongereduceerde model en de bijbehorende testvoorspellingen staan respectievelijk in dt_fit en predict_df. De UMAP-workflow die je hebt gemaakt staat in umap_dt_workflow. De sets train en test zijn ook voor je beschikbaar.
De pakketten tidyverse, tidymodels en embed zijn alvast voor je geladen.
Deze oefening maakt deel uit van de cursus
Dimensionality Reduction in R
Oefeninstructies
- Gebruik
f_measom de prestaties van de ongereduceerdedt_fitte evalueren. - Fit het UMAP-gereduceerde model met
umap_dt_workflow. - Maak het predictiedataframe voor de testset voor het gereduceerde UMAP-model.
- Gebruik
f_measom de prestaties van de gereduceerdeumap_dt_fitte evalueren.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Evaluate the unreduced decision tree model performance
___(___, ___, ___)
# Fit the UMAP decision tree model
umap_dt_fit <- ___ %>%
fit(___ = ___)
# Create test set prediction data frame for the UMAP model
predict_umap_df <- ___ %>%
___(predict = ___(___, ___))
# Calculate F1 performance of the UMAP model
___(___, ___, ___)