PCA – Dimensionsreduktion
In der vorherigen Übung hast du mit einem Datensatz mit zwei Variablen gearbeitet. Im Vorstellungsgespräch triffst du wahrscheinlich auf einen größeren Datensatz.
Mit PCA kannst du die Anzahl der Variablen reduzieren, ohne viel Informationsgehalt zu verlieren.
PCA liefert einen Datensatz in derselben Größe wie dein Originaldatensatz. Du entscheidest, wie viele Variablen du behältst!
Die folgenden Parameter von prcomp() reduzieren die Dimensionen basierend auf:
tol– der Standardabweichung als Prozentsatz der Standardabweichung der ersten Komponente,rank– der maximalen Anzahl an Komponenten.
Der Datensatz letters enthält numerische Merkmale von Buchstaben.
Diese Übung ist Teil des Kurses
Statistik-Interviewfragen in R üben
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Perform PCA on letters
pca_letters <- ___(letters)
# Output spread measures of principal components
___(pca_letters)