Complete modelleerworkflow
In deze oefening gebruik je de functie last_fit() om een logistische regressie te trainen en de prestaties op de testdata te evalueren aan de hand van de ROC-curve en de oppervlakte onder de ROC-curve.
Net als in eerdere oefeningen voorspel je canceled_service in de telecom_df-data, maar nu met een extra voorspeller om te zien of je de modelprestatie kunt verbeteren.
De telecom_df-tibble, telecom_split en logistic_model uit de vorige oefeningen zijn al in je workspace geladen. Het object telecom_split bevat de instructies om de telecom_df-tibble willekeurig op te splitsen in trainings- en testsets. Het object logistic_model is een parsnip-specificatie van een logistisch regressiemodel.
Deze oefening maakt deel uit van de cursus
Modelleren met tidymodels in R
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Train a logistic regression model
logistic_fit <- ___ %>%
last_fit(___,
split = ___)