CommencerCommencer gratuitement

Compréhensions de liste pour des données horodatées

Vous allez maintenant mettre en pratique ce que vous avez appris dans ce chapitre pour résoudre un petit problème d’extraction de données. Cet exercice vous présentera aussi une structure de données : la Series de pandas. Nous n’entrerons pas dans les détails ici, mais retenez que vous la manipulerez très souvent lors de l’analyse de données à partir de DataFrames pandas. Vous pouvez considérer les colonnes d’un DataFrame comme des tableaux unidimensionnels appelés Series.

Dans cet exercice, vous utiliserez une compréhension de liste pour extraire l’heure à partir de données Twitter horodatées. Le paquet pandas a été importé sous le nom pd et le fichier 'tweets.csv' a été chargé dans le DataFrame df pour votre usage.

Cet exercice fait partie du cours

Boîte à outils Python

Afficher le cours

Instructions

  • Extrayez la colonne 'created_at' de df et affectez le résultat à tweet_time. Fun fact : la colonne extraite dans tweet_time est ici une structure de données de type Series !
  • Créez une compréhension de liste qui extrait l’heure de chaque ligne de tweet_time. Chaque ligne est une chaîne représentant un horodatage ; vous accéderez donc aux caractères du 12e au 19e de la chaîne pour extraire l’heure. Utilisez entry comme variable d’itération et affectez le résultat à tweet_clock_time. N’oubliez pas que Python utilise un indexage commençant à 0 !

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Extract the created_at column from df: tweet_time
tweet_time = ____

# Extract the clock time: tweet_clock_time
tweet_clock_time = [____]

# Print the extracted times
print(tweet_clock_time)
Modifier et exécuter le code