Ejecutar un ETL Pipeline
¿Listo para ejecutar tu primera canalización ETL? ¡Manos a la obra!
Aquí se han definido para ti las funciones extract()
, transform()
, y load()
. Para ejecutar este canal ETL de datos, vas a ejecutar cada una de estas funciones. Si tienes curiosidad, echa un vistazo al aspecto de la función extract()
.
def extract(file_name):
print(f"Extracting data from {file_name}")
return pd.read_csv(file_name)
Este ejercicio forma parte del curso
ETL y ELT en Python
Instrucciones del ejercicio
- Utiliza la función
extract()
para extraer los datos del archivoraw_data.csv
. - Transforma el DataFrame
extracted_data
utilizando la funcióntransform()
. - Por último, carga el DataFrame
transformed_data
en la tabla SQLcleaned_data
.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Extract data from the raw_data.csv file
extracted_data = ____(file_name="raw_data.csv")
# Transform the extracted_data
transformed_data = transform(data_frame=____)
# Load the transformed_data to cleaned_data.csv
____(data_frame=transformed_data, target_table="cleaned_data")