Costruire una pipeline ETL
Pronto a rendere l'esercizio ancora più interessante? In questo esercizio, dovrai completare il resto della funzione load() prima di eseguire ciascun passaggio del processo ETL. Le funzioni extract() e transform() sono già state definite per te. Buon lavoro!
Questo esercizio fa parte del corso
ETL and ELT in Python
Istruzioni dell'esercizio
- Completa la funzione
load()scrivendo il DataFrametransformed_datain un file.csv, usandofile_name. - Usa la funzione
transform()per pulire il DataFrameextracted_data. - Carica
transformed_datanel filetransformed_data.csvusando la funzioneload().
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
def load(data_frame, file_name):
# Write cleaned_data to a CSV using file_name
data_frame.____(____)
print(f"Successfully loaded data to {file_name}")
extracted_data = extract(file_name="raw_data.csv")
# Transform extracted_data using transform() function
transformed_data = ____(data_frame=____)
# Load transformed_data to the file transformed_data.csv
____(data_frame=____, file_name="transformed_data.csv")