Churn mit Entscheidungsbaum vorhersagen
Jetzt baust du auf den Fähigkeiten aus der vorherigen Übung auf und erstellst einen komplexeren Entscheidungsbaum mit zusätzlichen Parametern, um Kundenabwanderung (Churn) vorherzusagen. Im nächsten Kapitel gehst du tiefer in das Churn-Problem hinein. Hier führst du den Decision-Tree-Classifier erneut auf deinen Trainingsdaten aus, sagst die Churn-Rate auf unbekannten (Test-)Daten voraus und bewertest die Modellgenauigkeit auf beiden Datensätzen.
Das tree-Modul aus der sklearn-Bibliothek wurde bereits für dich geladen, ebenso die Funktion accuracy_score aus sklearn.metrics. Die Feature- und Zielvariablen wurden ebenfalls importiert: als train_X, train_Y für Trainingsdaten und test_X, test_Y für Testdaten.
Diese Übung ist Teil des Kurses
Machine Learning für Marketing mit Python
Anleitung zur Übung
- Initialisiere einen Decision Tree mit einer maximalen Tiefe von 7 und verwende das gini-Kriterium.
- Fitte das Modell auf die Trainingsdaten.
- Sage die Werte auf dem Testdatensatz voraus.
- Gib die Genauigkeitswerte für sowohl Trainings- als auch Testdatensatz aus.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Initialize the Decision Tree
clf = tree.DecisionTreeClassifier(max_depth = ___,
criterion = 'gini',
splitter = 'best')
# Fit the model to the training data
clf = clf.___(train_X, train_Y)
# Predict the values on test dataset
pred_Y = clf.___(test_X)
# Print accuracy values
print("Training accuracy: ", np.round(clf.score(train_X, train_Y), 3))
print("Test accuracy: ", np.round(___(test_Y, pred_Y), 3))