CommencerCommencer gratuitement

Distributions selon le CTR

Pour chaque variable, il est utile d’examiner à la fois sa distribution et la façon dont elle varie avec la variable d’intérêt. Dans cet exercice, vous allez explorer la variable search_engine_type, un entier indiquant le moteur de recherche (comme Google ou Bing) par lequel l’utilisateur a exprimé son intention avant l’affichage de la publicité. Pour des raisons de confidentialité, ces catégories sont anonymisées. Vous commencerez par construire et observer la distribution de search_engine_type. Ensuite, vous étudierez comment le CTR varie selon la valeur de search_engine_type, comme vous l’avez fait dans le chapitre précédent pour la répartition du CTR par type d’appareil et position de la bannière.

Des données d’exemple sous forme de DataFrame sont chargées dans df. pandas sous l’alias pd est également disponible dans votre environnement de travail.

Cet exercice fait partie du cours

Prédire le CTR avec le Machine Learning en Python

Afficher le cours

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Construct bar chart for clicks by search engine type
se_df = df.____(['search_engine_type', 'click']).size().unstack()
se_df.plot(kind = 'bar', title = 'Value frequency for search engine type')
plt.show()
Modifier et exécuter le code