1. Apprendre
  2. /
  3. Cours
  4. /
  5. Boîte à outils Python

Connected

Exercice

Traitement des données par blocs (1)

Parfois, les sources de données sont si volumineuses qu'il devient trop coûteux en ressources de charger l'ensemble du jeu de données en mémoire. Dans cet exercice, vous allez traiter les 1000 premières lignes d'un fichier, une ligne à la fois, afin de créer un dictionnaire qui comptera combien de fois chaque pays apparaît dans une colonne du jeu de données.

Le fichier CSV 'world_dev_ind.csv' se trouve dans votre répertoire de travail. Pour commencer, vous devez ouvrir une connexion à ce fichier à l'aide de ce que l'on appelle un gestionnaire de contexte. Par exemple, la commande with open('datacamp.csv') as datacamp lie le fichier CSV 'datacamp.csv' à datacamp dans le gestionnaire de contexte. Ici, l'instruction with est le gestionnaire de contexte et son rôle est de veiller à une gestion efficace des ressources lors de l'ouverture d'une connexion à un fichier.

Pour en savoir plus sur les gestionnaires de contexte, consultez le cours DataCamp sur l'importation de données en Python.

Instructions

100 XP
  • Utilisez open() pour lier le fichier CSV 'world_dev_ind.csv' à file dans le gestionnaire de contexte.
  • Complétez la boucle for afin qu'elle s'exécute 1000 fois pour effectuer le corps de la boucle et traiter uniquement les 1000 premières lignes du fichier.