Daten vor der PCA skalieren
Wenn du mit Daten arbeitest, deren Merkmale unterschiedlich skaliert sind, ist es oft wichtig, die Daten zuerst zu skalieren. Der Grund: Merkmale mit größeren Werten können die Analyse beeinflussen, selbst wenn ihre Variabilität relativ gering ist.
Der Data-Frame combine ist bereits für dich geladen.
Diese Übung ist Teil des Kurses
<Kurs>Lineare Algebra für Data Science in R</Kurs>Übungsanweisungen
- Verwende die Funktion
scale(), um die 5. bis 12. Spalte dercombine-Daten zu skalieren. Nenne diesen Data-FrameBund zeige mithead()einige Werte an. - Verwende
prcomp(), um eine Hauptkomponentenanalyse durchzuführen, und fasse die Analyse mitsummary()zusammen.
Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Scale columns 5-12 of combine
B <- ___(___[, 5:12])
# Print the first 6 rows of the data
___
# Summarize the principal component analysis
summary(____(B))