IniziaInizia gratis

Questioni pratiche: scaling

Nel video hai visto che scalare i dati prima di fare la PCA cambia i risultati del modello di PCA. Qui eseguirai la PCA con e senza scaling, quindi visualizzerai i risultati usando i biplot.

A volte lo scaling è appropriato quando le varianze delle variabili sono molto diverse. Questo accade spesso quando le variabili hanno unità di misura differenti, ad esempio gradi Fahrenheit (temperatura) e miglia (distanza). Decidere se usare lo scaling è un passaggio importante quando esegui un'analisi delle componenti principali.

Questo esercizio fa parte del corso

Unsupervised Learning in R

Visualizza il corso

Istruzioni dell'esercizio

Lo stesso dataset dei Pokemon è disponibile nel tuo workspace come pokemon, ma è stata aggiunta una nuova variabile: Total.

  • In cima all'editor trovi del codice per calcolare media e deviazione standard di ogni variabile nel modello. Esegui questo codice per vedere come cambia la scala delle variabili nei dati originali.
  • Crea un modello di PCA di pokemon con scaling, assegnando il risultato a pr.with.scaling.
  • Crea un modello di PCA di pokemon senza scaling, assegnando il risultato a pr.without.scaling.
  • Usa biplot() per tracciare entrambi i modelli (uno alla volta) e confrontarne i risultati.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Mean of each variable
colMeans(pokemon)

# Standard deviation of each variable
apply(pokemon, 2, sd)

# PCA model with scaling: pr.with.scaling


# PCA model without scaling: pr.without.scaling


# Create biplots of both for comparison

Modifica ed esegui il codice