CommencerCommencer gratuitement

Exécution d'un pipeline ETL

Prêt à lancer votre premier pipeline ETL ? Passons à l’action !

Ici, les fonctions extract(), transform(), et load() ont été définies pour vous. Pour exécuter ce pipeline ETL de données, vous allez exécuter chacune de ces fonctions. Si vous êtes curieux, jetez un coup d'œil à la fonction extract().

def extract(file_name):
    print(f"Extracting data from {file_name}")
    return pd.read_csv(file_name)

Cet exercice fait partie du cours

ETL et ELT en Python

Afficher le cours

Instructions

  • Utilisez la fonction extract() pour extraire les données du fichier raw_data.csv.
  • Transformez le DataFrame extracted_data à l'aide de la fonction transform().
  • Enfin, chargez le DataFrame transformed_data dans le tableau SQL cleaned_data.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Extract data from the raw_data.csv file
extracted_data = ____(file_name="raw_data.csv")

# Transform the extracted_data
transformed_data = transform(data_frame=____)

# Load the transformed_data to cleaned_data.csv
____(data_frame=transformed_data, target_table="cleaned_data")
Modifier et exécuter le code