Esplora il churn rate e dividi i dati
Partendo dalla panoramica che hai visto nel Capitolo 1, in questa lezione approfondirai la preparazione dei dati necessaria per usare il Machine Learning per prevedere il churn. Esplorerai la distribuzione del churn e dividerai i dati in training e testing prima di passare alla modellazione. In questo passaggio capirai come è distribuito il churn rate e pre-processerai i dati in modo da poter costruire un modello sul training set e valutarne le prestazioni sui dati di test non utilizzati.
Il dataset telecom è stato caricato come pandas DataFrame chiamato telcom. La colonna della variabile target si chiama Churn.
Questo esercizio fa parte del corso
Machine Learning per il marketing con Python
Istruzioni dell'esercizio
- Stampa i valori univoci nella colonna
Churn. - Calcola la dimensione relativa (rapporto) di ciascun gruppo di churn.
- Importa la funzione per dividere i dati in train e test.
- Dividi i dati in 75% train e 25% test.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Print the unique Churn values
print(___(telcom['Churn']))
# Calculate the ratio size of each churn group
telcom.___(['Churn']).size() / telcom.shape[0] * 100
# Import the function for splitting data to train and test
from sklearn.model_selection import ___
# Split the data into train and test
train, test = ___(telcom, test_size = .25)