Visualisierung der Trennbarkeit von Klassen mit PCA I
Eine häufige Frage in ML-Vorstellungsgesprächen ist die Visualisierung der Dimensionalität nach einer PCA. In dieser Übung machst du genau das: Du zeichnest die ersten 2 Hauptkomponenten von loan_data, um die Trennung der Klassen anhand des Kreditstatus (vollständig zurückgezahlt oder abgeschrieben) zwischen beiden Komponenten zu visualisieren.
Der Datensatz loan_data wurde skaliert und per One-Hot-Encoding umgewandelt, d. h. kategoriale Variablen wurden in binäre Indikatoren überführt, da Merkmale vor der PCA sowohl auf derselben Skala als auch numerisch vorliegen sollten.
Ein PCA-Modell mit 2 Hauptkomponenten sowie das Grundgerüst für eine Grafik mit x- und y-Beschriftung und Titel wurden bereits für dich vorbereitet. In den Aufgaben verwendest du ein DataFrame namens loan_data_PCA. Die möglichen Werte für die Zielvariable Loan Status sind 0 und 1. Du zeichnest PC1 auf der x-Achse und PC2 auf der y-Achse.
Bereits importiert sind matplotlib.pyplot als plt, seaborn als sns und PCA aus sklearn.decomposition.
Diese Übung ist Teil des Kurses
ML-Vorstellungsgespräche in Python üben
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
targets = [____, ____]
colors = ['r', 'b']
# For loop to create plot
for target, color in zip(____, ____):
indicesToKeep = ____['____'] == ____