Verteilungen nach CTR
Für jedes einzelne Feature ist es hilfreich, sowohl die Verteilung des Features als auch seine Abhängigkeit von der Zielvariable anzuschauen. In dieser Übung untersuchst du das Feature search_engine_type. Es ist eine Ganzzahl, die die Suchmaschine bezeichnet, über die die Nutzerintention vor der Anzeige erfasst wurde, z. B. Google oder Bing. Aus Datenschutzgründen sind diese Kategorien anonymisiert. Zuerst erstellst du die Verteilung von search_engine_type und schaust sie dir an. Danach siehst du dir an, wie die CTR in Abhängigkeit vom Wert von search_engine_type variiert – ähnlich wie du im vorherigen Kapitel die CTR nach Gerätetyp und Banner-Position aufgeschlüsselt hast.
Beispieldaten im DataFrame-Format sind als df geladen. pandas als pd ist ebenfalls in deinem Workspace verfügbar.
Diese Übung ist Teil des Kurses
CTR-Vorhersage mit Machine Learning in Python
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Construct bar chart for clicks by search engine type
se_df = df.____(['search_engine_type', 'click']).size().unstack()
se_df.plot(kind = 'bar', title = 'Value frequency for search engine type')
plt.show()