CommencerCommencer gratuitement

Premiers pas

Dans cet exercice, vous allez parcourir rapidement des données d’exemple à l’aide d’opérations de base sur des DataFrame et jeter un premier regard au CTR. Les données proviennent d’Avazu, une plateforme publicitaire mondiale de premier plan, et capturent les interactions des utilisateurs sur divers types d’appareils pour différents sites web et applications.

La variable cible se trouve dans la colonne click. L’heure est au format YYMMDDHH, et il existe quelques colonnes entières : device_type pour le type d’appareil, banner_pos pour la position d’une bannière publicitaire (également appelée publicité display), etc. D’autres variables seront abordées dans les chapitres suivants.

Un échantillon de données sous forme de DataFrame est chargé sous le nom df. pandas sous pd est disponible dans votre espace de travail.

Cet exercice fait partie du cours

Prédire le CTR avec le Machine Learning en Python

Afficher le cours

Instructions

  • Définissez la variable X en utilisant .isin(). X correspondra à toutes les colonnes sauf la colonne click.
  • Définissez la variable y, accessible via df.click.
  • Affichez la proportion de lignes de y qui valent 1 — cela représente le CTR de l’échantillon, en utilisant y.sum().

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Look at basics of Dataframe 
print(df.head(5))
print(df.columns)

# Define X and y
X = df.____[:, ~df.columns.____(['click'])]
y = df.____

# Sample CTR
print("Sample CTR :\n", 
      y.____/len(y))
Modifier et exécuter le code