Esplora il churn rate e dividi i dati

Partendo dalla panoramica che hai visto nel Capitolo 1, in questa lezione approfondirai la preparazione dei dati necessaria per usare il Machine Learning per prevedere il churn. Esplorerai la distribuzione del churn e dividerai i dati in training e testing prima di passare alla modellazione. In questo passaggio capirai come è distribuito il churn rate e pre-processerai i dati in modo da poter costruire un modello sul training set e valutarne le prestazioni sui dati di test non utilizzati.

Il dataset telecom è stato caricato come pandas DataFrame chiamato telcom. La colonna della variabile target si chiama Churn.

Questo esercizio fa parte del corso

Machine Learning per il marketing con Python

Visualizza corso

Istruzioni dell'esercizio

Stampa i valori univoci nella colonna Churn.
Calcola la dimensione relativa (rapporto) di ciascun gruppo di churn.
Importa la funzione per dividere i dati in train e test.
Dividi i dati in 75% train e 25% test.

esercizio interattivo pratico

Prova questo esercizio completando questo codice di esempio.

# Print the unique Churn values
print(___(telcom['Churn']))

# Calculate the ratio size of each churn group
telcom.___(['Churn']).size() / telcom.shape[0] * 100

# Import the function for splitting data to train and test
from sklearn.model_selection import ___

# Split the data into train and test
train, test = ___(telcom, test_size = .25)

Modifica ed esegui il codice