Een eerste CTR-model
In deze oefening bouw je een eerste CTR-model op de Avazu-gegevensset met een decision tree en evalueer je de nauwkeurigheid van het model met accuracy_score() uit sklearn. Daarnaast gebruik je train_test_split() uit sklearn om de data in training en test te splitsen in plaats van, zoals eerder, handmatig een splitpunt te kiezen.
In je werkruimte zijn voorbeeldgegevens in DataFrame-vorm geladen als df, samen met sklearn en pandas als pd.
We doen een basis-split tussen training en test en evalueren onze resultaten met behulp van accuracy.
Deze oefening maakt deel uit van de cursus
CTR voorspellen met Machine Learning in Python
Oefeninstructies
- Definieer
Xenyals respectievelijk de features en de target op basis van de kolomclick. - Splits de data in trainings- en testsets met
train_test_split(X, y). - Maak een decision tree-classifier.
- Maak voorspellingen met de classifier en evalueer de nauwkeurigheid van die voorspellingen.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Define X and y
X = df.____[:, ~df.columns.____(['click'])]
y = df.click
# Define training and testing
X_train, X_test, y_train, y_test = \
____(____, _____, test_size = .2, random_state = 0)
# Create decision tree classifier
clf = ____()
# Train classifier - predict label and evaluate accuracy
y_pred = clf.fit(____, _____).____(X_test)
print(____(y_test, y_pred))