Het podium voorbereiden
Je gaat de gegevensset attrition_num verkennen vanuit het perspectief van PCA om te begrijpen of het haalbaar is om de dimensionaliteit te verlagen terwijl je de meeste informatie behoudt. Begin met het maken van een recipe die features met bijna-nulvariantie wegfiltert, de data normaliseert en PCA toepast.
De gegevensset attrition_num is al voor je geladen.
Deze oefening maakt deel uit van de cursus
Feature engineering in R
Oefeninstructies
- Verwijder mogelijke features met bijna-nulvariantie.
- Normaliseer alle numerieke data.
- Pas PCA toe.
- Raadpleeg de namen van de outputelementen door de recipe voor te bereiden.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
pc_recipe <- recipe(~., data = attrition_num) %>%
# Remove possible near-zero variance features
___(all_numeric()) %>%
# Normalize all numeric data
___(___()) %>%
# Apply PCA
___(all_numeric())
# Access the names of the output elements by preparing the recipe
pca_output <- ___(___)
names(pca_output)