Exécution d'un pipeline ETL
Prêt à lancer votre premier pipeline ETL ? Passons à l’action !
Ici, les fonctions extract()
, transform()
, et load()
ont été définies pour vous. Pour exécuter ce pipeline ETL de données, vous allez exécuter chacune de ces fonctions. Si vous êtes curieux, jetez un coup d'œil à la fonction extract()
.
def extract(file_name):
print(f"Extracting data from {file_name}")
return pd.read_csv(file_name)
Cet exercice fait partie du cours
ETL et ELT en Python
Instructions
- Utilisez la fonction
extract()
pour extraire les données du fichierraw_data.csv
. - Transformez le DataFrame
extracted_data
à l'aide de la fonctiontransform()
. - Enfin, chargez le DataFrame
transformed_data
dans le tableau SQLcleaned_data
.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Extract data from the raw_data.csv file
extracted_data = ____(file_name="raw_data.csv")
# Transform the extracted_data
transformed_data = transform(data_frame=____)
# Load the transformed_data to cleaned_data.csv
____(data_frame=transformed_data, target_table="cleaned_data")