Ejecutar un ETL Pipeline

¿Listo para ejecutar tu primera canalización ETL? ¡Manos a la obra!

Aquí se han definido para ti las funciones extract(), transform(), y load(). Para ejecutar este canal ETL de datos, vas a ejecutar cada una de estas funciones. Si tienes curiosidad, echa un vistazo al aspecto de la función extract().

def extract(file_name):
    print(f"Extracting data from {file_name}")
    return pd.read_csv(file_name)

Este ejercicio forma parte del curso

ETL y ELT en Python

Ver curso

Instrucciones del ejercicio

Utiliza la función extract() para extraer los datos del archivo raw_data.csv.
Transforma el DataFrame extracted_data utilizando la función transform().
Por último, carga el DataFrame transformed_data en la tabla SQL cleaned_data.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Extract data from the raw_data.csv file
extracted_data = ____(file_name="raw_data.csv")

# Transform the extracted_data
transformed_data = transform(data_frame=____)

# Load the transformed_data to cleaned_data.csv
____(data_frame=transformed_data, target_table="cleaned_data")

Editar y ejecutar código