Daten vor der PCA skalieren
Wenn du mit Daten arbeitest, deren Merkmale unterschiedlich skaliert sind, ist es oft wichtig, die Daten zuerst zu skalieren. Der Grund: Merkmale mit größeren Werten können die Analyse beeinflussen, selbst wenn ihre Variabilität relativ gering ist.
Der Data-Frame combine ist bereits für dich geladen.
Diese Übung ist Teil des Kurses
Lineare Algebra für Data Science in R
Anleitung zur Übung
- Verwende die Funktion
scale(), um die 5. bis 12. Spalte dercombine-Daten zu skalieren. Nenne diesen Data-FrameBund zeige mithead()einige Werte an. - Verwende
prcomp(), um eine Hauptkomponentenanalyse durchzuführen, und fasse die Analyse mitsummary()zusammen.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Scale columns 5-12 of combine
B <- ___(___[, 5:12])
# Print the first 6 rows of the data
___
# Summarize the principal component analysis
summary(____(B))