Validating data loaded to a Postgres Database
En este ejercicio, por fin vas a construir una canalización de datos de extremo a extremo. Esta canalización extraerá las calificaciones de pruebas escolares de un archivo JSON y transformará los datos para eliminar las filas con calificaciones faltantes. Además, cada escuela se clasificará por la ciudad en la que se encuentra, según su puntuación total. Por último, el conjunto de datos transformado se almacenará en una base de datos Postgres.
Para darte ventaja, las funciones extract() y transform() ya están creadas y se usan como se muestra a continuación. Además, pandas se ha importado como pd. ¡Mucha suerte!
# Extract and clean the testing scores.
raw_testing_scores = extract("testing_scores.json")
cleaned_testing_scores = transform(raw_testing_scores)
Este ejercicio forma parte del curso
ETL and ELT con Python
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
def load(clean_data, con_engine):
# Store the data in the schools database
clean_data.____(
name="scores_by_city",
con=con_engine,
____="____", # Make sure to replace existing data
index=True,
index_label="school_id"
)