Ejecutar un ETL Pipeline
¿Listo para ejecutar tu primera canalización ETL? ¡Manos a la obra!
Aquí se han definido para ti las funciones extract(), transform(), y load(). Para ejecutar este canal ETL de datos, vas a ejecutar cada una de estas funciones. Si tienes curiosidad, echa un vistazo al aspecto de la función extract().
def extract(file_name):
print(f"Extracting data from {file_name}")
return pd.read_csv(file_name)
Este ejercicio forma parte del curso
ETL y ELT en Python
Instrucciones del ejercicio
- Utiliza la función
extract()para extraer los datos del archivoraw_data.csv. - Transforma el DataFrame
extracted_datautilizando la funcióntransform(). - Por último, carga el DataFrame
transformed_dataen la tabla SQLcleaned_data.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Extract data from the raw_data.csv file
extracted_data = ____(file_name="raw_data.csv")
# Transform the extracted_data
transformed_data = transform(data_frame=____)
# Load the transformed_data to cleaned_data.csv
____(data_frame=transformed_data, target_table="cleaned_data")