CommencerCommencer gratuitement

Construire un pipeline ETL

Prêt à passer à la vitesse supérieure ? Dans cet exercice, vous serez chargé de construire le reste de la fonction load() avant d'exécuter chaque étape du processus ETL. Les fonctions extract() et transform() ont été définies pour vous. Bonne chance !

Cet exercice fait partie du cours

ETL et ELT en Python

Afficher le cours

Instructions

  • Complétez la fonction load() en écrivant le DataFrame transformed_data dans un fichier .csv, à l'aide de file_name.
  • Utilisez la fonction transform() pour nettoyer le DataFrame extracted_data.
  • Chargez transformed_data dans le fichier transformed_data.csv à l'aide de la fonction load().

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

def load(data_frame, file_name):
  # Write cleaned_data to a CSV using file_name
  data_frame.____(____)
  print(f"Successfully loaded data to {file_name}")

extracted_data = extract(file_name="raw_data.csv")

# Transform extracted_data using transform() function
transformed_data = ____(data_frame=____)

# Load transformed_data to the file transformed_data.csv
____(data_frame=____, file_name="transformed_data.csv")
Modifier et exécuter le code