Een eerste CTR-model

In deze oefening bouw je een eerste CTR-model op de Avazu-gegevensset met een decision tree en evalueer je de nauwkeurigheid van het model met accuracy_score() uit sklearn. Daarnaast gebruik je train_test_split() uit sklearn om de data in training en test te splitsen in plaats van, zoals eerder, handmatig een splitpunt te kiezen.

In je werkruimte zijn voorbeeldgegevens in DataFrame-vorm geladen als df, samen met sklearn en pandas als pd.

We doen een basis-split tussen training en test en evalueren onze resultaten met behulp van accuracy.

Deze oefening maakt deel uit van de cursus

CTR voorspellen met Machine Learning in Python

Oefeninstructies

Definieer X en y als respectievelijk de features en de target op basis van de kolom click.
Splits de data in trainings- en testsets met train_test_split(X, y).
Maak een decision tree-classifier.
Maak voorspellingen met de classifier en evalueer de nauwkeurigheid van die voorspellingen.

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Define X and y 
X = df.____[:, ~df.columns.____(['click'])]
y = df.click

# Define training and testing
X_train, X_test, y_train, y_test = \
	____(____, _____, test_size = .2, random_state = 0)

# Create decision tree classifier
clf = ____()

# Train classifier - predict label and evaluate accuracy
y_pred = clf.fit(____, _____).____(X_test) 
print(____(y_test, y_pred))

Code bewerken en uitvoeren

Deze oefening maakt deel uit van de cursus

CTR voorspellen met Machine Learning in Python

SkillTag.level.intermediateSkillTag.label

4.9+

Begin gratis met de cursus

De kans is groot dat je op deze pagina bent omdat je op een link hebt geklikt. In dit hoofdstuk leer je waarom click-through rates (CTR) essentieel zijn voor gerichte advertenties, hoe je basisbewerkingen op DataFrames uitvoert en hoe je machine learning-modellen kunt gebruiken om CTR te voorspellen.

Exercise 1: Introductie tot click-through rates Exercise 2: Eerste stappen Exercise 3: Verkenning van features Exercise 4: Eerste evaluatie van de data Exercise 5: Overzicht van machine learning-modellen Exercise 6: Logistische regressie voor borstkanker Exercise 7: Logistische regressie voor afbeeldingen Exercise 8: Een tweede speelgoedmodel Exercise 9: CTR-voorspelling met beslissingsbomen Exercise 10: Modelimplementatie Exercise 11: Een eerste CTR-model

Huidige oefening

Exercise 12: Verder kijken dan alleen accuracy

Dit hoofdstuk legt de basis voor exploratieve data-analyse (EDA). Met voorbeelddata gebruik je de pandas-bibliotheek om naar kolommen en datatypen te kijken, missende waarden te verkennen en hashing te gebruiken om feature engineering uit te voeren op categorische features. Dit alles is belangrijk bij het verkennen van features voor nauwkeurigere CTR-voorspelling.

Exercise 1: Exploratieve data-analyse Exercise 2: Een eerste blik Exercise 3: Controleren op ontbrekende waarden Exercise 4: Verdelingen per CTR Exercise 5: Feature engineering Exercise 6: Datum-tijdkolommen analyseren Exercise 7: Categorische variabelen omzetten Exercise 8: Nieuwe features maken Exercise 9: Features standaardiseren Exercise 10: Log-normalisatie Exercise 11: Standaardisatie begrijpen Exercise 12: Standaardschaling

Tijd om de diepte in te gaan. Ontdek hoe je maatstaven voor modelprestaties, zoals precision en recall, kunt gebruiken om praktijkvragen te beantwoorden, zoals het evalueren van de ROI op advertentie-uitgaven. Je leert ook manieren om die evaluatiemetrics te verbeteren, zoals ensemblemethoden en hyperparametertuning.

Exercise 1: Toepassingen van metriekevaluatie Exercise 2: Vier categorieën uitkomsten Exercise 3: Vier categorieën evalueren Exercise 4: ROI op advertentiebesteding Exercise 5: Modelevaluatie Exercise 6: Precisie en recall Exercise 7: Baseline Exercise 8: Classificatiemodellen vergelijken Exercise 9: Modellen afstemmen Exercise 10: Regularisatie Exercise 11: Cross-validation Exercise 12: Modelselectie Exercise 13: Ensembles en hyperparametertuning Exercise 14: Begrijpen van hyperparameter tuning Exercise 15: Random forests Exercise 16: Grid search

Je campagne-CTR kan de winst sterk beïnvloeden. In dit hoofdstuk leer je hoe deep learning dat risico kan verkleinen. Je richt je op multi-layer perceptron (MLP) en neurale netwerkmodellen, en leert hoe je hiermee de complexe relatie tussen variabelen vastlegt om CTR nauwkeuriger te voorspellen. Tot slot verken je hoe je de basis van hyperparametertuning en regularisatie toepast op classificatiemodellen.

Exercise 1: Introductie tot deep learning Exercise 2: MLP's begrijpen Exercise 3: Startmodel Exercise 4: MLP's voor CTR Exercise 5: Hyperparametertuning in deep learning Exercise 6: Hyperparametertuning in MLP's Exercise 7: Variëren van hyperparameters Exercise 8: MLP Grid Search Exercise 9: Modelbeoordeling Exercise 10: F-beta-score Exercise 11: Lage precision en hoge AUC Exercise 12: Precision, ROI en AUC Exercise 13: Modelbeoordeling en -vergelijking Exercise 14: Voorbereiding modelvergelijking Exercise 15: Precisie en ROI evalueren Exercise 16: Totale score Exercise 17: Afsluitende video