Exécution d'un pipeline ETL

Vous êtes prêt à gérer votre premier pipeline ETL? Allons-y !

Ici, les fonctions extract(), transform(), et load() ont été définies pour vous. Pour exécuter ce pipeline de données ETL, vous allez exécuter chacune de ces fonctions. Si vous êtes curieux, jetez un coup d'œil à la fonction extract().

def extract(file_name):

    print(f"Extracting data from {file_name}")

    return pd.read_csv(file_name)

Cet exercice fait partie du cours

<cours>ETL et ELT en Python</cours>

Voir le cours

Instructions de l’exercice

Utilisez la fonction extract() pour extraire les données du fichier raw_data.csv.
Transformez le DataFrame extracted_data à l'aide de la fonction transform().
Enfin, chargez le DataFrame transformed_data dans le tableau cleaned_data SQL.

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

# Extract data from the raw_data.csv file
extracted_data = ____(file_name="raw_data.csv")

# Transform the extracted_data
transformed_data = transform(data_frame=____)

# Load the transformed_data to cleaned_data.csv
____(data_frame=transformed_data, target_table="cleaned_data")

Modifier et exécuter le code