CommencerCommencer gratuitement

Analyser des colonnes datetime

L’ingénierie des caractéristiques est une étape essentielle de tout flux de travail en Machine Learning pour traiter des variables de différents types. Les colonnes de type datetime sont notamment très fréquentes dans de nombreux jeux de données. Dans cet exercice, vous allez explorer la colonne hour du jeu de données, qui est stockée comme un entier mais représente un datetime. Vous commencerez par analyser la colonne hour pour la convertir en colonne datetime. Vous en extrayerez ensuite l’heure de la journée à partir de cette colonne datetime, puis vous calculerez le nombre total de clics en fonction de cette heure de la journée.

Le module pandas est disponible sous le nom pd dans votre espace de travail et le DataFrame d’exemple est chargé sous le nom df.

Cet exercice fait partie du cours

Prédire le CTR avec le Machine Learning en Python

Afficher le cours

Instructions

  • Convertissez la colonne hour d’un entier en une colonne datetime en utilisant pd.to_datetime().
  • À l’aide de l’accesseur datetime .dt, extrayez le champ heure de la colonne convertie avec .hour.
  • Calculez le total des clics par heure extraite de la journée à l’aide de .sum().

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Change the hour column to a datetime and extract hour of day
df['hour'] = pd.____(df['hour'], format = '%y%m%d%H')
df['hour_of_day'] = df['hour'].____.____
print(df.head(5))

# Get and plot total clicks by hour of day
df.____('hour_of_day')['click'].____.plot.bar(figsize=(12,6))
plt.ylabel('Number of clicks')
plt.title('Number of clicks by hour of day')
plt.show()
Modifier et exécuter le code