Eerste stappen
In deze oefening bekijk je snel voorbeeldgegevens met een paar basisbewerkingen op DataFrames en neem je een eerste kijkje naar CTR. De data komt van Avazu, een toonaangevend wereldwijd advertentieplatform, en bevat gebruikersinteracties op verschillende apparaattype voor diverse websites en apps.
De doelvariabele staat in de kolom click. Het uur staat in het formaat YYMMDDHH, en er zijn een paar integerkolommen: device_type voor het type apparaat, banner_pos voor de positie van een banneradvertentie (ook wel display-ad genoemd), enzovoort. Andere variabelen komen in latere hoofdstukken aan bod.
Voorbeeldgegevens in DataFrame-vorm zijn geladen als df. pandas als pd is beschikbaar in je workspace.
Deze oefening maakt deel uit van de cursus
CTR voorspellen met Machine Learning in Python
Oefeninstructies
- Definieer variabele
Xmet.isin().Xbevat alle kolommen behalve de kolomclick. - Definieer variabele
y, die je kunt benaderen metdf.click. - Print het aandeel rijen van
ydat een1is — dit stelt de voorbeeld-CTR voor — mety.sum().
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Look at basics of Dataframe
print(df.head(5))
print(df.columns)
# Define X and y
X = df.____[:, ~df.columns.____(['click'])]
y = df.____
# Sample CTR
print("Sample CTR :\n",
y.____/len(y))