Compréhension de liste pour les données horodatées
Vous allez maintenant utiliser ce que vous avez appris dans ce chapitre pour résoudre un problème simple d'extraction de données. Cet exercice vous permettra également de découvrir une structure de données, la série pandas. Nous ne nous étendrons pas beaucoup sur le sujet ici, mais ce que vous devez savoir, c'est qu'il s'agit d'une structure de données avec laquelle vous travaillerez très souvent lorsque vous analyserez des données provenant de DataFrame pandas. Vous pouvez considérer les colonnes du DataFrame comme des tableaux unidimensionnels appelés Series.
Dans cet exercice, vous utiliserez une compréhension de liste pour extraire l'heure à partir de données Twitter horodatées. Le paquet pandas a été importé en tant que pd
et le fichier 'tweets.csv'
a été importé en tant que DataFrame df
pour votre usage.
Cet exercice fait partie du cours
Boîte à outils Python
Instructions
- Extrayez la colonne
'created_at'
dedf
et affectez le résultat àtweet_time
. Fait amusant : la colonne extraite danstweet_time
est une structure de données Series ! - Créez une compréhension de liste qui extrait l'heure de chaque ligne de
tweet_time
. Chaque ligne est une chaîne qui représente un horodatage, et vous accéderez aux 12e à 19e caractères de la chaîne pour en extraire l'heure. Utilisezentry
comme variable itératrice et affectez le résultat àtweet_clock_time
. N'oubliez pas que Python utilise une indexation basée sur 0 !
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Extract the created_at column from df: tweet_time
tweet_time = ____
# Extract the clock time: tweet_clock_time
tweet_clock_time = [____]
# Print the extracted times
print(tweet_clock_time)