Decision tree-model fitten
Je gaat nu een decision tree trainen op de trainingsset van de telecomgegevensset, vervolgens labels voorspellen op de niet-geziene testdata en de accuracy van je modelvoorspellingen berekenen. Je ziet dan het verschil in performance vergeleken met logistic regression.
De functie accuracy_score is geïmporteerd. Ook zijn de trainings- en testgegevens die je eerder hebt opgebouwd geladen als train_X en test_X voor features, en train_Y en test_Y voor targetvariabelen.
Deze oefening maakt deel uit van de cursus
Machine Learning voor marketing in Python
Oefeninstructies
- Initialiseer een decision tree-classifier.
- Train de decision tree op de trainingsdata.
- Voorspel churnlabels op de testdata.
- Bereken en print de accuracy-score op de testdata.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Initialize decision tree classifier
mytree = tree.___()
# Fit the decision tree on training data
mytree.___(___, ___)
# Predict churn labels on testing data
pred_test_Y = ___.___(___)
# Calculate accuracy score on testing data
test_accuracy = ___(___, ___)
# Print test accuracy
print('Test accuracy:', round(___, 4))