Ejecutar una canalización ETL
¿Listo para ejecutar tu primera canalización ETL? ¡Vamos a ello!
Aquí ya tienes definidas las funciones extract(), transform() y load(). Para ejecutar esta canalización ETL de datos, vas a llamar a cada una de estas funciones. Si te da curiosidad, echa un vistazo a cómo es la función extract().
def extract(file_name):
print(f"Extracting data from {file_name}")
return pd.read_csv(file_name)
Este ejercicio forma parte del curso
ETL and ELT con Python
Instrucciones del ejercicio
- Usa la función
extract()para extraer datos del archivoraw_data.csv. - Transforma el DataFrame
extracted_datausando la funcióntransform(). - Por último, carga el DataFrame
transformed_dataen la tabla SQLcleaned_data.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Extract data from the raw_data.csv file
extracted_data = ____(file_name="raw_data.csv")
# Transform the extracted_data
transformed_data = transform(data_frame=____)
# Load the transformed_data to cleaned_data.csv
____(data_frame=transformed_data, target_table="cleaned_data")