Ein erstes CTR-Modell
In dieser Übung baust du auf dem Avazu-Datensatz ein erstes CTR-Modell mit einem Entscheidungsbaum und bewertest die Genauigkeit des Modells mit accuracy_score() aus sklearn. Außerdem verwendest du train_test_split() aus sklearn, um Trainings- und Testdaten zu trennen, anstatt wie zuvor den Split-Punkt manuell festzulegen.
In deinem Workspace sind Beispieldaten als DataFrame unter df geladen sowie sklearn und pandas als pd.
Wir führen einen einfachen Training-/Test-Split durch und bewerten unsere Ergebnisse anhand der Accuracy.
Diese Übung ist Teil des Kurses
CTR-Vorhersage mit Machine Learning in Python
Anleitung zur Übung
- Definiere
Xundyals Features bzw. Zielvariable auf Basis der Spalteclick. - Teile die Daten mit
train_test_split(X, y)in Trainings- und Testmengen auf. - Erstelle einen Entscheidungsbaum-Klassifikator.
- Erzeuge Vorhersagen mit dem Klassifikator und bewerte die Genauigkeit dieser Vorhersagen.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Define X and y
X = df.____[:, ~df.columns.____(['click'])]
y = df.click
# Define training and testing
X_train, X_test, y_train, y_test = \
____(____, _____, test_size = .2, random_state = 0)
# Create decision tree classifier
clf = ____()
# Train classifier - predict label and evaluate accuracy
y_pred = clf.fit(____, _____).____(X_test)
print(____(y_test, y_pred))