Construir un ETL Pipeline
¿Listo para aumentar la diversión? En este ejercicio, te encargarás de construir el resto de la función load()
antes de ejecutar cada paso del proceso ETL. Se han definido para ti las funciones extract()
y transform()
. Buena suerte.
Este ejercicio forma parte del curso
ETL y ELT en Python
Instrucciones del ejercicio
- Completa la función
load()
escribiendo el DataFrametransformed_data
en un archivo.csv
, utilizandofile_name
. - Utiliza la función
transform()
para limpiar el DataFrameextracted_data
. - Carga
transformed_data
en el archivotransformed_data.csv
utilizando la funciónload()
.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
def load(data_frame, file_name):
# Write cleaned_data to a CSV using file_name
data_frame.____(____)
print(f"Successfully loaded data to {file_name}")
extracted_data = extract(file_name="raw_data.csv")
# Transform extracted_data using transform() function
transformed_data = ____(data_frame=____)
# Load transformed_data to the file transformed_data.csv
____(data_frame=____, file_name="transformed_data.csv")