Churn mit Entscheidungsbaum vorhersagen

Jetzt baust du auf den Fähigkeiten aus der vorherigen Übung auf und erstellst einen komplexeren Entscheidungsbaum mit zusätzlichen Parametern, um Kundenabwanderung (Churn) vorherzusagen. Im nächsten Kapitel gehst du tiefer in das Churn-Problem hinein. Hier führst du den Decision-Tree-Classifier erneut auf deinen Trainingsdaten aus, sagst die Churn-Rate auf unbekannten (Test-)Daten voraus und bewertest die Modellgenauigkeit auf beiden Datensätzen.

Das tree-Modul aus der sklearn-Bibliothek wurde bereits für dich geladen, ebenso die Funktion accuracy_score aus sklearn.metrics. Die Feature- und Zielvariablen wurden ebenfalls importiert: als train_X, train_Y für Trainingsdaten und test_X, test_Y für Testdaten.

Diese Übung ist Teil des Kurses

<Kurs>Machine Learning für Marketing mit Python</Kurs>

Kurs ansehen

Übungsanweisungen

Initialisiere einen Decision Tree mit einer maximalen Tiefe von 7 und verwende das gini-Kriterium.
Fitte das Modell auf die Trainingsdaten.
Sage die Werte auf dem Testdatensatz voraus.
Gib die Genauigkeitswerte für sowohl Trainings- als auch Testdatensatz aus.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Initialize the Decision Tree
clf = tree.DecisionTreeClassifier(max_depth = ___, 
               criterion = 'gini', 
               splitter  = 'best')

# Fit the model to the training data
clf = clf.___(train_X, train_Y)

# Predict the values on test dataset
pred_Y = clf.___(test_X)

# Print accuracy values
print("Training accuracy: ", np.round(clf.score(train_X, train_Y), 3)) 
print("Test accuracy: ", np.round(___(test_Y, pred_Y), 3))

Code bearbeiten und ausführen