Aan de slagGa gratis aan de slag

Complete modelleerworkflow

In deze oefening gebruik je de functie last_fit() om een logistische regressie te trainen en de prestaties op de testdata te evalueren aan de hand van de ROC-curve en de oppervlakte onder de ROC-curve.

Net als in eerdere oefeningen voorspel je canceled_service in de telecom_df-data, maar nu met een extra voorspeller om te zien of je de modelprestatie kunt verbeteren.

De telecom_df-tibble, telecom_split en logistic_model uit de vorige oefeningen zijn al in je workspace geladen. Het object telecom_split bevat de instructies om de telecom_df-tibble willekeurig op te splitsen in trainings- en testsets. Het object logistic_model is een parsnip-specificatie van een logistisch regressiemodel.

Deze oefening maakt deel uit van de cursus

Modelleren met tidymodels in R

Cursus bekijken

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Train a logistic regression model
logistic_fit <- ___ %>% 
  last_fit(___, 
           split = ___)
Code bewerken en uitvoeren