Exploration des variables
En utilisant le même jeu de données Avazu, vous allez explorer la répartition des valeurs de device_type et de banner_pos, ainsi que la variation du CTR en fonction de ces variables.
Des données d’exemple sous forme de DataFrame sont chargées dans df. Les variables X et y que vous avez créées dans l’exercice précédent sont disponibles dans votre espace de travail. pandas sous l’alias pd est également disponible dans votre espace de travail.
Cet exercice fait partie du cours
Prédire le CTR avec le Machine Learning en Python
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Distribution of values for device type
print("Distribution of device type: ")
print(X.device_type.____()/len(X))
# Sample CTR by device type
print("CTR by device type: ")
print(df.____('device_type')['click'].____/len(y))