Questioni pratiche: scaling
Nel video hai visto che scalare i dati prima di fare la PCA cambia i risultati del modello di PCA. Qui eseguirai la PCA con e senza scaling, quindi visualizzerai i risultati usando i biplot.
A volte lo scaling è appropriato quando le varianze delle variabili sono molto diverse. Questo accade spesso quando le variabili hanno unità di misura differenti, ad esempio gradi Fahrenheit (temperatura) e miglia (distanza). Decidere se usare lo scaling è un passaggio importante quando esegui un'analisi delle componenti principali.
Questo esercizio fa parte del corso
Unsupervised Learning in R
Istruzioni dell'esercizio
Lo stesso dataset dei Pokemon è disponibile nel tuo workspace come pokemon, ma è stata aggiunta una nuova variabile: Total.
- In cima all'editor trovi del codice per calcolare media e deviazione standard di ogni variabile nel modello. Esegui questo codice per vedere come cambia la scala delle variabili nei dati originali.
- Crea un modello di PCA di
pokemoncon scaling, assegnando il risultato apr.with.scaling. - Crea un modello di PCA di
pokemonsenza scaling, assegnando il risultato apr.without.scaling. - Usa
biplot()per tracciare entrambi i modelli (uno alla volta) e confrontarne i risultati.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Mean of each variable
colMeans(pokemon)
# Standard deviation of each variable
apply(pokemon, 2, sd)
# PCA model with scaling: pr.with.scaling
# PCA model without scaling: pr.without.scaling
# Create biplots of both for comparison