1. Apprendre
  2. /
  3. Cours
  4. /
  5. Boîte à outils Python

Connected

Exercice

Écrire un itérateur pour charger des données par blocs (3)

Vous êtes maintenant habitué à lire et à traiter des données par blocs. Poussons un peu plus vos compétences en ajoutant une colonne à un DataFrame.

En repartant du code de l'exercice précédent, vous allez utiliser une compréhension de liste pour créer les valeurs d'une nouvelle colonne 'Total Urban Population' à partir de la liste de tuples que vous avez déjà générée. Rappelez-vous, dans l'exercice précédent, que les premier et deuxième éléments de chaque tuple correspondent respectivement aux valeurs des colonnes 'Total Population' et 'Urban population (% of total)'. Les valeurs de cette nouvelle colonne 'Total Urban Population' sont donc le produit du premier et du deuxième élément de chaque tuple. De plus, comme le 2e élément est un pourcentage, vous devez diviser l'ensemble du résultat par 100, ou encore, le multiplier par 0.01.

Vous tracerez aussi les données de cette nouvelle colonne afin de visualiser les données sur la population urbaine.

Les modules pandas et matplotlib.pyplot ont été importés sous les noms pd et plt respectivement pour votre usage.

Instructions

100 XP
  • Écrivez une compréhension de liste pour générer, à partir de pops_list, la liste de valeurs de la nouvelle colonne 'Total Urban Population'. L'expression de sortie doit être le produit du premier et du deuxième élément de chaque tuple dans pops_list. Comme le 2e élément est un pourcentage, vous devez également soit multiplier le résultat par 0.01, soit le diviser par 100. De plus, notez que la colonne 'Total Urban Population' ne doit contenir que des valeurs entières. Pour l'assurer, convertissez l'expression de sortie en entier avec int().
  • Créez un graphique de type scatter où l'axe des x correspond aux valeurs de la colonne 'Year' et l'axe des y aux valeurs de la colonne 'Total Urban Population'.