Aan de slagGa gratis aan de slag

Eerste stappen

In deze oefening bekijk je snel voorbeeldgegevens met een paar basisbewerkingen op DataFrames en neem je een eerste kijkje naar CTR. De data komt van Avazu, een toonaangevend wereldwijd advertentieplatform, en bevat gebruikersinteracties op verschillende apparaattype voor diverse websites en apps.

De doelvariabele staat in de kolom click. Het uur staat in het formaat YYMMDDHH, en er zijn een paar integerkolommen: device_type voor het type apparaat, banner_pos voor de positie van een banneradvertentie (ook wel display-ad genoemd), enzovoort. Andere variabelen komen in latere hoofdstukken aan bod.

Voorbeeldgegevens in DataFrame-vorm zijn geladen als df. pandas als pd is beschikbaar in je workspace.

Deze oefening maakt deel uit van de cursus

CTR voorspellen met Machine Learning in Python

Cursus bekijken

Oefeninstructies

  • Definieer variabele X met .isin(). X bevat alle kolommen behalve de kolom click.
  • Definieer variabele y, die je kunt benaderen met df.click.
  • Print het aandeel rijen van y dat een 1 is — dit stelt de voorbeeld-CTR voor — met y.sum().

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Look at basics of Dataframe 
print(df.head(5))
print(df.columns)

# Define X and y
X = df.____[:, ~df.columns.____(['click'])]
y = df.____

# Sample CTR
print("Sample CTR :\n", 
      y.____/len(y))
Code bewerken en uitvoeren