Premiers pas
Dans cet exercice, vous allez parcourir rapidement des données d’exemple à l’aide d’opérations de base sur des DataFrame et jeter un premier regard au CTR. Les données proviennent d’Avazu, une plateforme publicitaire mondiale de premier plan, et capturent les interactions des utilisateurs sur divers types d’appareils pour différents sites web et applications.
La variable cible se trouve dans la colonne click. L’heure est au format YYMMDDHH, et il existe quelques colonnes entières : device_type pour le type d’appareil, banner_pos pour la position d’une bannière publicitaire (également appelée publicité display), etc. D’autres variables seront abordées dans les chapitres suivants.
Un échantillon de données sous forme de DataFrame est chargé sous le nom df. pandas sous pd est disponible dans votre espace de travail.
Cet exercice fait partie du cours
Prédire le CTR avec le Machine Learning en Python
Instructions
- Définissez la variable
Xen utilisant.isin().Xcorrespondra à toutes les colonnes sauf la colonneclick. - Définissez la variable
y, accessible viadf.click. - Affichez la proportion de lignes de
yqui valent1— cela représente le CTR de l’échantillon, en utilisanty.sum().
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Look at basics of Dataframe
print(df.head(5))
print(df.columns)
# Define X and y
X = df.____[:, ~df.columns.____(['click'])]
y = df.____
# Sample CTR
print("Sample CTR :\n",
y.____/len(y))