1. Apprendre
  2. /
  3. Cours
  4. /
  5. ETL et ELT en Python

Connected

Exercice

Extraire des données à partir de fichiers Parquet

L'une des façons les plus courantes d'ingérer des données depuis un système source consiste à lire un fichier, par exemple un fichier CSV. Comme les données ont pris de l'ampleur, le besoin de formats de fichiers plus efficaces a mené à de nouveaux formats en colonnes, comme les fichiers Parquet.

Dans cet exercice, vous allez vous exercer à extraire des données d'un fichier Parquet.

Instructions

100 XP
  • Lisez le fichier Parquet situé au chemin "sales_data.parquet" dans un DataFrame pandas.
  • Vérifiez les types de données du DataFrame en les affichant avec print().
  • Affichez la dimension (shape) du DataFrame ainsi que ses premières lignes (head).