Compréhensions de liste pour des données horodatées
Vous allez maintenant mettre en pratique ce que vous avez appris dans ce chapitre pour résoudre un petit problème d’extraction de données. Cet exercice vous présentera aussi une structure de données : la Series de pandas. Nous n’entrerons pas dans les détails ici, mais retenez que vous la manipulerez très souvent lors de l’analyse de données à partir de DataFrames pandas. Vous pouvez considérer les colonnes d’un DataFrame comme des tableaux unidimensionnels appelés Series.
Dans cet exercice, vous utiliserez une compréhension de liste pour extraire l’heure à partir de données Twitter horodatées. Le paquet pandas a été importé sous le nom pd et le fichier 'tweets.csv' a été chargé dans le DataFrame df pour votre usage.
Cet exercice fait partie du cours
Boîte à outils Python
Instructions
- Extrayez la colonne
'created_at'dedfet affectez le résultat àtweet_time. Fun fact : la colonne extraite danstweet_timeest ici une structure de données de type Series ! - Créez une compréhension de liste qui extrait l’heure de chaque ligne de
tweet_time. Chaque ligne est une chaîne représentant un horodatage ; vous accéderez donc aux caractères du 12e au 19e de la chaîne pour extraire l’heure. Utilisezentrycomme variable d’itération et affectez le résultat àtweet_clock_time. N’oubliez pas que Python utilise un indexage commençant à 0 !
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Extract the created_at column from df: tweet_time
tweet_time = ____
# Extract the clock time: tweet_clock_time
tweet_clock_time = [____]
# Print the extracted times
print(tweet_clock_time)