LoslegenKostenlos loslegen

Daten vor der PCA skalieren

Wenn du mit Daten arbeitest, deren Merkmale unterschiedlich skaliert sind, ist es oft wichtig, die Daten zuerst zu skalieren. Der Grund: Merkmale mit größeren Werten können die Analyse beeinflussen, selbst wenn ihre Variabilität relativ gering ist.

Der Data-Frame combine ist bereits für dich geladen.

Diese Übung ist Teil des Kurses

Lineare Algebra für Data Science in R

Kurs anzeigen

Anleitung zur Übung

  • Verwende die Funktion scale(), um die 5. bis 12. Spalte der combine-Daten zu skalieren. Nenne diesen Data-Frame B und zeige mit head() einige Werte an.
  • Verwende prcomp(), um eine Hauptkomponentenanalyse durchzuführen, und fasse die Analyse mit summary() zusammen.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Scale columns 5-12 of combine
B <- ___(___[, 5:12])

# Print the first 6 rows of the data
___

# Summarize the principal component analysis
summary(____(B))
Code bearbeiten und ausführen