Eseguire la PCA
Il prossimo passo della tua analisi è eseguire una PCA su wisc.data.
Nel capitolo precedente hai visto che è importante verificare se i dati devono essere scalati prima di eseguire la PCA. Ricorda due motivi comuni per scalare i dati:
- Le variabili in input usano unità di misura diverse.
- Le variabili in input hanno varianze significativamente diverse.
Questo esercizio fa parte del corso
Unsupervised Learning in R
Istruzioni dell'esercizio
Le variabili che hai creato prima, wisc.data e diagnosis, sono ancora disponibili nel tuo workspace.
- Controlla la media e la deviazione standard delle feature dei dati per stabilire se i dati devono essere scalati. Usa le funzioni
colMeans()eapply()come hai fatto in precedenza. - Esegui la PCA su
wisc.data, scalando se opportuno, e assegna il modello awisc.pr. - Esamina un riepilogo dei risultati con la funzione
summary().
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Check column means and standard deviations
# Execute PCA, scaling if appropriate: wisc.pr
# Look at summary of results