PCs mit einem Scree-Plot visualisieren
In einem Machine-Learning-Interview kann die Frage auftauchen, wie viele Merkmale optimal beibehalten werden sollten. In dieser Übung erstellst du einen Scree-Plot und einen Plot der kumulativen erklärten Varianz der Hauptkomponenten mithilfe von PCA auf loan_data.
Das hilft dir, die optimale Anzahl an PCs für das Training eines genaueren ML-Modells zu bestimmen.
Da PCA ein unüberwachtes Verfahren ist, wird die Hauptkomponentenanalyse auf der X-Matrix durchgeführt, nachdem die Zielvariable Loan Status aus dem Datensatz entfernt wurde. Wenn n_components nicht gesetzt wird, gibt das trainierte Modell alle Hauptkomponenten zurück.
Diese Übung ist Teil des Kurses
ML-Vorstellungsgespräche in Python üben
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Remove target variable
X = loan_data.____('____', axis=1)
# Instantiate
pca = ____(n_components=____)
# Fit and transform
principalComponents = pca.____(____)