or
Deze oefening maakt deel uit van de cursus
Maak je klaar om grote gegevenssets te vereenvoudigen! Je leert over informatie, hoe je het belang van features beoordeelt, en oefent met het herkennen van features met weinig informatie. Aan het eind van dit hoofdstuk begrijp je het verschil tussen featureselectie en feature-extractie — de twee benaderingen voor dimensionaliteitsreductie.
Leer hoe je informatie-rijke en informatie-arme features identificeert aan de hand van verhoudingen ontbrekende waarden, variantie en correlatie. Daarna ontdek je hoe je tidymodels-recipes opstelt om features te selecteren met deze informatie-indicatoren.
Hoofdstuk drie introduceert het verschil tussen onbewaakte en bewaakte benaderingen voor featureselectie. Je herhaalt hoe je met tidymodels-workflows modellen bouwt. Vervolgens voer je bewaakte featureselectie uit met lasso-regressie en random forest-modellen.
In dit laatste hoofdstuk ontwikkel je een sterke intuïtie voor feature-extractie door te begrijpen hoe hoofcomponenten de belangrijkste informatie uit verschillende features extraheren en combineren. Vervolgens leer je drie soorten feature-extractie kennen en toepassen — principal component analysis (PCA), t-SNE en UMAP. Ontdek hoe je deze methoden voor feature-extractie als preprocess-stap kunt inzetten in het modelbouwproces met tidymodels.
Huidige oefening