Evalueer het UMAP-beslisboommodel

In de vorige oefening heb je een workflow gemaakt om UMAP toe te passen en een beslisboommodel te bouwen. Nu ga je het model fitten met die trainingsdata en de prestaties vergelijken met het ongereduceerde beslisboommodel. Omdat de doelvariabele credit_score categorisch is, gebruik je f_meas() om de prestaties van de modellen te evalueren. Het ongereduceerde model en de bijbehorende testvoorspellingen staan respectievelijk in dt_fit en predict_df. De UMAP-workflow die je hebt gemaakt staat in umap_dt_workflow. De sets train en test zijn ook voor je beschikbaar.

De pakketten tidyverse, tidymodels en embed zijn alvast voor je geladen.

Deze oefening maakt deel uit van de cursus

Dimensionality Reduction in R

Bekijk cursus

Oefeninstructies

Gebruik f_meas om de prestaties van de ongereduceerde dt_fit te evalueren.
Fit het UMAP-gereduceerde model met umap_dt_workflow.
Maak het predictiedataframe voor de testset voor het gereduceerde UMAP-model.
Gebruik f_meas om de prestaties van de gereduceerde umap_dt_fit te evalueren.

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Evaluate the unreduced decision tree model performance
___(___, ___, ___)

# Fit the UMAP decision tree model
umap_dt_fit <- ___ %>% 
  fit(___ = ___)

# Create test set prediction data frame for the UMAP model
predict_umap_df <- ___ %>% 
  ___(predict = ___(___, ___))

# Calculate F1 performance of the UMAP model
___(___, ___, ___)

Code bewerken en uitvoeren