Predire il churn con un albero decisionale

Ora farai leva sulle competenze acquisite nell'esercizio precedente e costruirai un albero decisionale più complesso con parametri aggiuntivi per prevedere il churn dei clienti. Approfondirai il problema della previsione del churn nel prossimo capitolo. Qui eseguirai di nuovo il classificatore ad albero decisionale sui dati di training, prevederai il tasso di churn su dati non visti (test) e valuterai l'accuratezza del modello su entrambi gli insiemi di dati.

Il modulo tree della libreria sklearn è già stato caricato per te, così come la funzione accuracy_score da sklearn.metrics. Le variabili delle caratteristiche e dell'obiettivo sono state importate come train_X, train_Y per i dati di training e test_X, test_Y per i dati di test.

Questo esercizio fa parte del corso

Machine Learning per il marketing con Python

Visualizza corso

Istruzioni dell'esercizio

Inizializza un albero decisionale con profondità massima impostata a 7 e usando il criterio gini.
Fai il fit del modello sui dati di training.
Prevedi i valori sul dataset di test.
Stampa i valori di accuratezza per i dataset di training e di test.

esercizio interattivo pratico

Prova questo esercizio completando questo codice di esempio.

# Initialize the Decision Tree
clf = tree.DecisionTreeClassifier(max_depth = ___, 
               criterion = 'gini', 
               splitter  = 'best')

# Fit the model to the training data
clf = clf.___(train_X, train_Y)

# Predict the values on test dataset
pred_Y = clf.___(test_X)

# Print accuracy values
print("Training accuracy: ", np.round(clf.score(train_X, train_Y), 3)) 
print("Test accuracy: ", np.round(___(test_Y, pred_Y), 3))

Modifica ed esegui il codice