Distribuzioni per CTR
Per ogni singola caratteristica, è utile osservare sia la distribuzione della feature sia come varia rispetto alla variabile di interesse. In questo esercizio esplorerai la feature search_engine_type, che è un intero che identifica il motore di ricerca, come Google o Bing, tramite il quale l’utente ha espresso l’intento che ha portato all’annuncio. Per motivi di privacy, queste categorie sono anonime. Per prima cosa costruirai e visualizzerai la distribuzione di search_engine_type. Poi osserverai come il CTR varia in base al valore di search_engine_type, in modo simile a come hai analizzato il CTR per tipo di dispositivo e posizione del banner nel capitolo precedente.
Dati di esempio in forma di DataFrame sono caricati come df. pandas come pd è già disponibile nel tuo workspace.
Questo esercizio fa parte del corso
Prevedere il CTR con il Machine Learning in Python
esercizio interattivo pratico
Prova questo esercizio completando questo codice di esempio.
# Construct bar chart for clicks by search engine type
se_df = df.____(['search_engine_type', 'click']).size().unstack()
se_df.plot(kind = 'bar', title = 'Value frequency for search engine type')
plt.show()