Verdelingen per CTR
Voor een individuele feature is het nuttig om zowel naar de verdeling van die feature te kijken als naar hoe die samenhangt met de variabele waarin je geïnteresseerd bent. In deze oefening verken je de feature search_engine_type, een geheel getal dat de zoekmachine aangeeft — zoals Google of Bing — waarmee de gebruiker zijn intentie uitte voorafgaand aan de advertentie. Om privacyredenen zijn deze categorieën anoniem. Eerst maak je de verdeling van search_engine_type en bekijk je die. Daarna kijk je hoe de CTR varieert op basis van de waarde van search_engine_type, vergelijkbaar met hoe je in het vorige hoofdstuk de CTR uitsplitste naar apparaattype en bannerpositie.
Voorbeelddata in DataFrame-vorm is geladen als df. pandas als pd is ook beschikbaar in je werkruimte.
Deze oefening maakt deel uit van de cursus
CTR voorspellen met Machine Learning in Python
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Construct bar chart for clicks by search engine type
se_df = df.____(['search_engine_type', 'click']).size().unstack()
se_df.plot(kind = 'bar', title = 'Value frequency for search engine type')
plt.show()