Erste Schritte
In dieser Übung wirfst du mit ein paar grundlegenden DataFrame-Operationen einen schnellen Blick auf Beispieldaten und nimmst einen ersten Blick auf die CTR. Die Daten stammen von Avazu, einer führenden globalen Werbeplattform, und erfassen Nutzerinteraktionen auf verschiedenen Gerätetypen für unterschiedliche Websites und Apps.
Die Zielvariable steht in der Spalte click. Die Stunde ist im Format YYMMDDHH gespeichert, und es gibt einige Integer-Spalten: device_type für den Gerätetyp, banner_pos für die Position eines Banner-Ads (auch Display-Ad genannt) usw. Weitere Variablen werden in späteren Kapiteln besprochen.
Beispieldaten in DataFrame-Form sind als df geladen. pandas als pd steht dir in deinem Workspace zur Verfügung.
Diese Übung ist Teil des Kurses
CTR-Vorhersage mit Machine Learning in Python
Anleitung zur Übung
- Definiere die Variable
Xmithilfe von.isin().Xsoll alle Spalten außer der Spalteclickenthalten. - Definiere die Variable
y; du kannst sie überdf.clickabrufen. - Gib den Anteil der Zeilen von
yaus, die1sind – das entspricht der Beispiel-CTR – mithilfe vony.sum().
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Look at basics of Dataframe
print(df.head(5))
print(df.columns)
# Define X and y
X = df.____[:, ~df.columns.____(['click'])]
y = df.____
# Sample CTR
print("Sample CTR :\n",
y.____/len(y))