LoslegenKostenlos loslegen

Ein erstes CTR-Modell

In dieser Übung baust du auf dem Avazu-Datensatz ein erstes CTR-Modell mit einem Entscheidungsbaum und bewertest die Genauigkeit des Modells mit accuracy_score() aus sklearn. Außerdem verwendest du train_test_split() aus sklearn, um Trainings- und Testdaten zu trennen, anstatt wie zuvor den Split-Punkt manuell festzulegen.

In deinem Workspace sind Beispieldaten als DataFrame unter df geladen sowie sklearn und pandas als pd.

Wir führen einen einfachen Training-/Test-Split durch und bewerten unsere Ergebnisse anhand der Accuracy.

Diese Übung ist Teil des Kurses

CTR-Vorhersage mit Machine Learning in Python

Kurs anzeigen

Anleitung zur Übung

  • Definiere X und y als Features bzw. Zielvariable auf Basis der Spalte click.
  • Teile die Daten mit train_test_split(X, y) in Trainings- und Testmengen auf.
  • Erstelle einen Entscheidungsbaum-Klassifikator.
  • Erzeuge Vorhersagen mit dem Klassifikator und bewerte die Genauigkeit dieser Vorhersagen.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Define X and y 
X = df.____[:, ~df.columns.____(['click'])]
y = df.click

# Define training and testing
X_train, X_test, y_train, y_test = \
	____(____, _____, test_size = .2, random_state = 0)

# Create decision tree classifier
clf = ____()

# Train classifier - predict label and evaluate accuracy
y_pred = clf.fit(____, _____).____(X_test) 
print(____(y_test, y_pred))
Code bearbeiten und ausführen