CommencerCommencer gratuitement

Compréhension de liste pour les données horodatées

Vous allez maintenant utiliser ce que vous avez appris dans ce chapitre pour résoudre un problème simple d'extraction de données. Cet exercice vous permettra également de découvrir une structure de données, la série pandas. Nous ne nous étendrons pas beaucoup sur le sujet ici, mais ce que vous devez savoir, c'est qu'il s'agit d'une structure de données avec laquelle vous travaillerez très souvent lorsque vous analyserez des données provenant de DataFrame pandas. Vous pouvez considérer les colonnes du DataFrame comme des tableaux unidimensionnels appelés Series.

Dans cet exercice, vous utiliserez une compréhension de liste pour extraire l'heure à partir de données Twitter horodatées. Le paquet pandas a été importé en tant que pd et le fichier 'tweets.csv' a été importé en tant que DataFrame df pour votre usage.

Cet exercice fait partie du cours

Boîte à outils Python

Afficher le cours

Instructions

  • Extrayez la colonne 'created_at' de df et affectez le résultat à tweet_time. Fait amusant : la colonne extraite dans tweet_time est une structure de données Series !
  • Créez une compréhension de liste qui extrait l'heure de chaque ligne de tweet_time. Chaque ligne est une chaîne qui représente un horodatage, et vous accéderez aux 12e à 19e caractères de la chaîne pour en extraire l'heure. Utilisez entry comme variable itératrice et affectez le résultat à tweet_clock_time. N'oubliez pas que Python utilise une indexation basée sur 0 !

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Extract the created_at column from df: tweet_time
tweet_time = ____

# Extract the clock time: tweet_clock_time
tweet_clock_time = [____]

# Print the extracted times
print(tweet_clock_time)
Modifier et exécuter le code