Exécution d'un pipeline ETL
Prêt à lancer votre premier pipeline ETL ? Passons à l’action !
Ici, les fonctions extract(), transform(), et load() ont été définies pour vous. Pour exécuter ce pipeline ETL de données, vous allez exécuter chacune de ces fonctions. Si vous êtes curieux, jetez un coup d'œil à la fonction extract().
def extract(file_name):
print(f"Extracting data from {file_name}")
return pd.read_csv(file_name)
Cet exercice fait partie du cours
ETL et ELT en Python
Instructions
- Utilisez la fonction
extract()pour extraire les données du fichierraw_data.csv. - Transformez le DataFrame
extracted_dataà l'aide de la fonctiontransform(). - Enfin, chargez le DataFrame
transformed_datadans le tableau SQLcleaned_data.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Extract data from the raw_data.csv file
extracted_data = ____(file_name="raw_data.csv")
# Transform the extracted_data
transformed_data = transform(data_frame=____)
# Load the transformed_data to cleaned_data.csv
____(data_frame=transformed_data, target_table="cleaned_data")