Eseguire una pipeline ETL
Pronto a eseguire la tua prima pipeline ETL? Iniziamo!
Qui le funzioni extract(), transform() e load() sono già state definite per te. Per eseguire questa pipeline ETL, dovrai richiamare ciascuna di queste funzioni. Se sei curioso, dai un’occhiata a com’è fatta la funzione extract().
def extract(file_name):
print(f"Extracting data from {file_name}")
return pd.read_csv(file_name)
Questo esercizio fa parte del corso
ETL and ELT in Python
Istruzioni dell'esercizio
- Usa la funzione
extract()per estrarre i dati dal fileraw_data.csv. - Trasforma il DataFrame
extracted_datausando la funzionetransform(). - Infine, carica il DataFrame
transformed_datanella tabella SQLcleaned_data.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Extract data from the raw_data.csv file
extracted_data = ____(file_name="raw_data.csv")
# Transform the extracted_data
transformed_data = transform(data_frame=____)
# Load the transformed_data to cleaned_data.csv
____(data_frame=transformed_data, target_table="cleaned_data")