Churn-Rate untersuchen und Daten aufteilen

Aufbauend auf dem Überblick aus Kapitel 1 tauchst du in dieser Lektion tiefer in die Datenaufbereitung für den Einsatz von Machine Learning zur Vorhersage von Churn ein. Du untersuchst die Verteilung des Churns und teilst die Daten in Training und Test, bevor du mit dem Modellieren fortfährst. In diesem Schritt verstehst du, wie die Churn-Rate verteilt ist, und bereitest die Daten vor, sodass du ein Modell auf dem Trainingssatz bauen und seine Leistung an ungenutzten Testdaten messen kannst.

Der Telekommunikations-Datensatz wurde als pandas DataFrame namens telcom geladen. Die Zielvariable heißt Churn.

Diese Übung ist Teil des Kurses

<Kurs>Machine Learning für Marketing mit Python</Kurs>

Kurs ansehen

Übungsanweisungen

Gib die eindeutigen Werte in der Spalte Churn aus.
Berechne den Größenanteil jeder Churn-Gruppe.
Importiere die Funktion zum Aufteilen der Daten in Train und Test.
Teile die Daten in 75 % Train und 25 % Test.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Print the unique Churn values
print(___(telcom['Churn']))

# Calculate the ratio size of each churn group
telcom.___(['Churn']).size() / telcom.shape[0] * 100

# Import the function for splitting data to train and test
from sklearn.model_selection import ___

# Split the data into train and test
train, test = ___(telcom, test_size = .25)

Code bearbeiten und ausführen