Erste Schritte
In dieser Übung wirfst du mit ein paar grundlegenden DataFrame-Operationen einen schnellen Blick auf Beispieldaten und nimmst einen ersten Blick auf die CTR. Die Daten stammen von Avazu, einer führenden globalen Werbeplattform, und erfassen Nutzerinteraktionen auf verschiedenen Gerätetypen für unterschiedliche Websites und Apps.
Die Zielvariable steht in der Spalte click. Die Stunde ist im Format YYMMDDHH gespeichert, und es gibt einige Integer-Spalten: device_type für den Gerätetyp, banner_pos für die Position eines Banner-Ads (auch Display-Ad genannt) usw. Weitere Variablen werden in späteren Kapiteln besprochen.
Beispieldaten in DataFrame-Form sind als df geladen. pandas als pd steht dir in deinem Workspace zur Verfügung.
Diese Übung ist Teil des Kurses
<Kurs>CTR-Vorhersage mit Machine Learning in Python</Kurs>Übungsanweisungen
- Definiere die Variable
Xmithilfe von.isin().Xsoll alle Spalten außer der Spalteclickenthalten. - Definiere die Variable
y; du kannst sie überdf.clickabrufen. - Gib den Anteil der Zeilen von
yaus, die1sind – das entspricht der Beispiel-CTR – mithilfe vony.sum().
Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Look at basics of Dataframe
print(df.head(5))
print(df.columns)
# Define X and y
X = df.____[:, ~df.columns.____(['click'])]
y = df.____
# Sample CTR
print("Sample CTR :\n",
y.____/len(y))