1. Apprendre
  2. /
  3. Cours
  4. /
  5. Boîte à outils Python

Connected

Exercice

Compréhensions de listes pour des données horodatées

Vous allez maintenant mettre à profit ce que vous avez appris dans ce chapitre pour résoudre un simple problème d'extraction de données. Vous serez également présenté à une structure de données, la Series de pandas, dans cet exercice. Nous n'entrerons pas dans les détails ici, mais retenez qu'il s'agit d'une structure de données que vous utiliserez très souvent quand vous analyserez des données provenant de DataFrames pandas. Vous pouvez voir les colonnes d'un DataFrame comme des tableaux unidimensionnels appelés Series.

Dans cet exercice, vous utiliserez une compréhension de liste pour extraire l'heure à partir de données Twitter horodatées. Le paquet pandas a été importé sous le nom pd et le fichier 'tweets.csv' a été importé dans le DataFrame df pour que vous puissiez l'utiliser.

Instructions

100 XP
  • Extrayez la colonne 'created_at' de df et assignez le résultat à tweet_time. Fait amusant : la colonne extraite dans tweet_time est ici une structure de données de type Series !
  • Créez une compréhension de liste qui extrait l'heure de chaque ligne dans tweet_time. Chaque ligne est une chaîne de caractères qui représente un horodatage, et vous accéderez aux 12e à 19e caractères de la chaîne pour extraire l'heure. Utilisez entry comme variable d'itération et assignez le résultat à tweet_clock_time. N'oubliez pas que Python utilise un indexage à partir de 0 !