IniziaInizia gratis

Eseguire una pipeline ETL

Pronto a eseguire la tua prima pipeline ETL? Iniziamo!

Qui le funzioni extract(), transform() e load() sono già state definite per te. Per eseguire questa pipeline ETL, dovrai richiamare ciascuna di queste funzioni. Se sei curioso, dai un’occhiata a com’è fatta la funzione extract().

def extract(file_name):
    print(f"Extracting data from {file_name}")
    return pd.read_csv(file_name)

Questo esercizio fa parte del corso

ETL and ELT in Python

Visualizza il corso

Istruzioni dell'esercizio

  • Usa la funzione extract() per estrarre i dati dal file raw_data.csv.
  • Trasforma il DataFrame extracted_data usando la funzione transform().
  • Infine, carica il DataFrame transformed_data nella tabella SQL cleaned_data.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Extract data from the raw_data.csv file
extracted_data = ____(file_name="raw_data.csv")

# Transform the extracted_data
transformed_data = transform(data_frame=____)

# Load the transformed_data to cleaned_data.csv
____(data_frame=transformed_data, target_table="cleaned_data")
Modifica ed esegui il codice