Aan de slagGa gratis aan de slag

Voorspellingen van één model

Om de performance van een classificatiemodel te berekenen, moet je de werkelijke waarden van Attrition vergelijken met die welke door het model zijn voorspeld. Bij het berekenen van statistieken voor binaire classificatietaken (zoals precision en recall) moeten de werkelijke en voorspelde vectoren worden omgezet naar binaire waarden.

In deze oefening leer je hoe je deze vectoren voorbereidt met behulp van het model en de validate-dataframes uit de eerste cross-validatiefold als voorbeeld.

Deze oefening maakt deel uit van de cursus

Machine Learning in de tidyverse

Cursus bekijken

Oefeninstructies

  • Haal het model en het validate-dataframe op uit de eerste fold van de cross-validatie.
  • Haal de kolom Attrition uit het validate-dataframe en zet de waarden om naar binair (TRUE/FALSE).
  • Gebruik model om de waarschijnlijkheden van attrition te voorspellen voor het validate-dataframe.
  • Zet de voorspelde waarschijnlijkheden om naar een binaire vector; ga ervan uit dat alle waarschijnlijkheden groter dan 0.5 TRUE zijn.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Extract the first model and validate 
model <- cv_models_lr$___[[___]]
validate <- cv_models_lr$___[[___]]

# Prepare binary vector of actual Attrition values in validate
validate_actual <- ___ == "Yes"

# Predict the probabilities for the observations in validate
validate_prob <- predict(___, ___, type = "response")

# Prepare binary vector of predicted Attrition values for validate
validate_predicted <- ___
Code bewerken en uitvoeren