Gecorreleerde predictoren verwijderen met recipes
Gecorreleerde predictorvariabelen verwijderen uit je trainings- en testgegevens is een belangrijke stap in feature engineering om ervoor te zorgen dat het fitten van je model zo soepel mogelijk verloopt.
Nu je hebt ontdekt dat monthly_charges en avg_data_gb sterk gecorreleerd zijn, moet je een correlatiefilter met step_corr() toevoegen aan je feature-engineeringpipeline voor de telecomgegevens.
In deze oefening maak je een recipe-object dat gecorreleerde predictoren uit de telecomgegevens verwijdert.
De gegevenssets telecom_training en telecom_test zijn in je sessie geladen.
Deze oefening maakt deel uit van de cursus
Modelleren met tidymodels in R
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Specify a recipe object
telecom_cor_rec <- recipe(___,
data = ___) %>%
# Remove correlated variables
___(___, threshold = ___)