or
Questo esercizio fa parte del corso
Preparati a semplificare grandi insiemi di dati! Imparerai cos’è l’informazione, come valutare l’importanza delle variabili e farai pratica nell’identificare le variabili a bassa informazione. Alla fine del capitolo capirai la differenza tra selezione delle variabili ed estrazione delle caratteristiche—i due approcci alla riduzione della dimensionalità.
Impara a individuare variabili ricche e povere di informazione usando rapporto di valori mancanti, varianza e correlazione. Poi scoprirai come creare ricette di tidymodels per selezionare le variabili utilizzando questi indicatori di informazione.
Il capitolo tre introduce la differenza tra approcci non supervisionati e supervisionati alla selezione delle variabili. Ripasserai come usare i workflow di tidymodels per costruire modelli. Quindi eseguirai una selezione supervisionata delle variabili usando la regressione lasso e modelli random forest.
In questo capitolo finale svilupperai una solida intuizione sull’estrazione delle caratteristiche comprendendo come le componenti principali estraggono e combinano le informazioni più importanti da variabili diverse. Poi imparerai e applicherai tre tipi di estrazione delle caratteristiche — principal component analysis (PCA), t-SNE e UMAP. Scoprirai come usare questi metodi di estrazione come fase di preprocessing nel processo di costruzione dei modelli con tidymodels.
Esercizio attuale