Aan de slagGa gratis aan de slag

Een eerste CTR-model

In deze oefening bouw je een eerste CTR-model op de Avazu-gegevensset met een decision tree en evalueer je de nauwkeurigheid van het model met accuracy_score() uit sklearn. Daarnaast gebruik je train_test_split() uit sklearn om de data in training en test te splitsen in plaats van, zoals eerder, handmatig een splitpunt te kiezen.

In je werkruimte zijn voorbeeldgegevens in DataFrame-vorm geladen als df, samen met sklearn en pandas als pd.

We doen een basis-split tussen training en test en evalueren onze resultaten met behulp van accuracy.

Deze oefening maakt deel uit van de cursus

CTR voorspellen met Machine Learning in Python

Cursus bekijken

Oefeninstructies

  • Definieer X en y als respectievelijk de features en de target op basis van de kolom click.
  • Splits de data in trainings- en testsets met train_test_split(X, y).
  • Maak een decision tree-classifier.
  • Maak voorspellingen met de classifier en evalueer de nauwkeurigheid van die voorspellingen.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Define X and y 
X = df.____[:, ~df.columns.____(['click'])]
y = df.click

# Define training and testing
X_train, X_test, y_train, y_test = \
	____(____, _____, test_size = .2, random_state = 0)

# Create decision tree classifier
clf = ____()

# Train classifier - predict label and evaluate accuracy
y_pred = clf.fit(____, _____).____(X_test) 
print(____(y_test, y_pred))
Code bewerken en uitvoeren