Aan de slagGa gratis aan de slag

Complete feature-engineeringpipeline

Het recipes-pakket is ontworpen om meerdere feature-engineeringstappen in één object te encoderen, zodat het makkelijker wordt om datatransformaties te beheren in een Machine Learning-workflow.

In deze oefening train je een feature-engineeringpipeline om de telecomgegevens voor te bereiden op modelleren.

De tibble telecom_df, evenals je telecom_training- en telecom_test-gegevenssets uit de vorige oefeningen, zijn geladen in je werkruimte.

Deze oefening maakt deel uit van de cursus

Modelleren met tidymodels in R

Cursus bekijken

Oefeninstructies

  • Maak een recipe die canceled_service voorspelt met alle voorspellers in de trainingsgegevens.
  • Verwijder gecorreleerde voorspellers met een drempelwaarde van 0,8.
  • Normaliseer alle numerieke voorspellers.
  • Maak dummyvariabelen voor alle nominale voorspellers.
  • Train je recipe op de trainingsgegevens en pas deze toe op de testgegevens.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Create a recipe that predicts canceled_service using the training data
telecom_recipe <- ___ %>% 
  # Remove correlated predictors
  ___ %>% 
  # Normalize numeric predictors
  ___ %>% 
  # Create dummy variables
  ___

# Train your recipe and apply it to the test data
telecom_recipe %>% 
  ___ %>% 
  ___
Code bewerken en uitvoeren