LoslegenKostenlos starten

Erste Schritte

In dieser Übung wirfst du mit ein paar grundlegenden DataFrame-Operationen einen schnellen Blick auf Beispieldaten und nimmst einen ersten Blick auf die CTR. Die Daten stammen von Avazu, einer führenden globalen Werbeplattform, und erfassen Nutzerinteraktionen auf verschiedenen Gerätetypen für unterschiedliche Websites und Apps.

Die Zielvariable steht in der Spalte click. Die Stunde ist im Format YYMMDDHH gespeichert, und es gibt einige Integer-Spalten: device_type für den Gerätetyp, banner_pos für die Position eines Banner-Ads (auch Display-Ad genannt) usw. Weitere Variablen werden in späteren Kapiteln besprochen.

Beispieldaten in DataFrame-Form sind als df geladen. pandas als pd steht dir in deinem Workspace zur Verfügung.

Diese Übung ist Teil des Kurses

<Kurs>CTR-Vorhersage mit Machine Learning in Python</Kurs>
Kurs ansehen

Übungsanweisungen

  • Definiere die Variable X mithilfe von .isin(). X soll alle Spalten außer der Spalte click enthalten.
  • Definiere die Variable y; du kannst sie über df.click abrufen.
  • Gib den Anteil der Zeilen von y aus, die 1 sind – das entspricht der Beispiel-CTR – mithilfe von y.sum().

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Look at basics of Dataframe 
print(df.head(5))
print(df.columns)

# Define X and y
X = df.____[:, ~df.columns.____(['click'])]
y = df.____

# Sample CTR
print("Sample CTR :\n", 
      y.____/len(y))
Code bearbeiten und ausführen