Churn-Rate untersuchen und Daten aufteilen
Aufbauend auf dem Überblick aus Kapitel 1 tauchst du in dieser Lektion tiefer in die Datenaufbereitung für den Einsatz von Machine Learning zur Vorhersage von Churn ein. Du untersuchst die Verteilung des Churns und teilst die Daten in Training und Test, bevor du mit dem Modellieren fortfährst. In diesem Schritt verstehst du, wie die Churn-Rate verteilt ist, und bereitest die Daten vor, sodass du ein Modell auf dem Trainingssatz bauen und seine Leistung an ungenutzten Testdaten messen kannst.
Der Telekommunikations-Datensatz wurde als pandas DataFrame namens telcom geladen. Die Zielvariable heißt Churn.
Diese Übung ist Teil des Kurses
Machine Learning für Marketing mit Python
Anleitung zur Übung
- Gib die eindeutigen Werte in der Spalte
Churnaus. - Berechne den Größenanteil jeder Churn-Gruppe.
- Importiere die Funktion zum Aufteilen der Daten in Train und Test.
- Teile die Daten in 75 % Train und 25 % Test.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Print the unique Churn values
print(___(telcom['Churn']))
# Calculate the ratio size of each churn group
telcom.___(['Churn']).size() / telcom.shape[0] * 100
# Import the function for splitting data to train and test
from sklearn.model_selection import ___
# Split the data into train and test
train, test = ___(telcom, test_size = .25)