Validar los datos cargados en una base de datos Postgres
En este ejercicio, por fin podrás construir una canalización de datos de principio a fin. Esta canalización extraerá las puntuaciones de las pruebas escolares de un archivo JSON y transformará los datos para eliminar las filas con puntuaciones que falten. Además, cada uno se clasificará según la ciudad en la que se encuentre, en función de su puntuación total. Por último, el conjunto de datos transformado se almacenará en una base de datos Postgres.
Para que te hagas una idea, las funciones extract()
y transform()
se han construido y utilizado como se muestra a continuación. Además, pandas
se ha importado como pd
. ¡Mucha suerte!
# Extract and clean the testing scores.
raw_testing_scores = extract("testing_scores.json")
cleaned_testing_scores = transform(raw_testing_scores)
Este ejercicio forma parte del curso
Introducción a las canalizaciones de datos
Ejercicio interactivo práctico
Pruebe este ejercicio completando este código de muestra.
def load(clean_data, con_engine):
# Store the data in the schools database
clean_data.____(
name="scores_by_city",
con=con_engine,
____="____", # Make sure to replace existing data
index=True,
index_label="school_id"
)