Aan de slagGa gratis aan de slag

Het podium voorbereiden

Je gaat de gegevensset attrition_num verkennen vanuit het perspectief van PCA om te begrijpen of het haalbaar is om de dimensionaliteit te verlagen terwijl je de meeste informatie behoudt. Begin met het maken van een recipe die features met bijna-nulvariantie wegfiltert, de data normaliseert en PCA toepast.

De gegevensset attrition_num is al voor je geladen.

Deze oefening maakt deel uit van de cursus

Feature engineering in R

Cursus bekijken

Oefeninstructies

  • Verwijder mogelijke features met bijna-nulvariantie.
  • Normaliseer alle numerieke data.
  • Pas PCA toe.
  • Raadpleeg de namen van de outputelementen door de recipe voor te bereiden.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

pc_recipe <- recipe(~., data = attrition_num) %>%

# Remove possible near-zero variance features
  ___(all_numeric()) %>%

# Normalize all numeric data
  ___(___()) %>%

# Apply PCA
  ___(all_numeric())

# Access the names of the output elements by preparing the recipe
pca_output <- ___(___)
names(pca_output)
Code bewerken en uitvoeren