Construire un pipeline ETL
Prêt à passer à la vitesse supérieure ? Dans cet exercice, vous serez chargé de construire le reste de la fonction load()
avant d'exécuter chaque étape du processus ETL. Les fonctions extract()
et transform()
ont été définies pour vous. Bonne chance !
Cet exercice fait partie du cours
ETL et ELT en Python
Instructions
- Complétez la fonction
load()
en écrivant le DataFrametransformed_data
dans un fichier.csv
, à l'aide defile_name
. - Utilisez la fonction
transform()
pour nettoyer le DataFrameextracted_data
. - Chargez
transformed_data
dans le fichiertransformed_data.csv
à l'aide de la fonctionload()
.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
def load(data_frame, file_name):
# Write cleaned_data to a CSV using file_name
data_frame.____(____)
print(f"Successfully loaded data to {file_name}")
extracted_data = extract(file_name="raw_data.csv")
# Transform extracted_data using transform() function
transformed_data = ____(data_frame=____)
# Load transformed_data to the file transformed_data.csv
____(data_frame=____, file_name="transformed_data.csv")