Features und Zielvariable trennen
Nachdem du die Daten in Training und Test aufgeteilt hast, steht der letzte Schritt vor dem Fitten des Modells an: Trenne die Features und die Zielvariable in eigene Datensätze. Dafür verwendest du die Liste der Spaltennamen, die bereits für dich geladen wurde.
Der Hauptdatensatz ist als telcom geladen und in Trainings- und Testdatensätze aufgeteilt, die als pandas DataFrames in train bzw. test vorliegen. Die Listen target und custid enthalten die Namen der Zielvariable bzw. der Kunden-ID. Du sollst die Liste cols mit den Namen der übrigen Spalten erstellen. Schau dir die Datensätze gern in der Konsole an.
Diese Übung ist Teil des Kurses
Machine Learning für Marketing mit Python
Anleitung zur Übung
- Speichere die Spaltennamen von
telcomin einer Liste, ausgenommen Zielvariable und Kunden-ID. - Extrahiere die Trainings-Features und das Trainingsziel.
- Extrahiere die Test-Features und das Testziel.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Store column names from `telcom` excluding target variable and customer ID
cols = [col for col in ___.columns if col not in ___ + target]
# Extract training features
train_X = train[___]
# Extract training target
train_Y = train[___]
# Extract testing features
test_X = test[___]
# Extract testing target
test_Y = test[___]