Aan de slagGa gratis aan de slag

Gecorreleerde predictoren verwijderen met recipes

Gecorreleerde predictorvariabelen verwijderen uit je trainings- en testgegevens is een belangrijke stap in feature engineering om ervoor te zorgen dat het fitten van je model zo soepel mogelijk verloopt.

Nu je hebt ontdekt dat monthly_charges en avg_data_gb sterk gecorreleerd zijn, moet je een correlatiefilter met step_corr() toevoegen aan je feature-engineeringpipeline voor de telecomgegevens.

In deze oefening maak je een recipe-object dat gecorreleerde predictoren uit de telecomgegevens verwijdert.

De gegevenssets telecom_training en telecom_test zijn in je sessie geladen.

Deze oefening maakt deel uit van de cursus

Modelleren met tidymodels in R

Cursus bekijken

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Specify a recipe object
telecom_cor_rec <- recipe(___,
                          data = ___) %>%
  # Remove correlated variables
  ___(___, threshold = ___)
Code bewerken en uitvoeren