ComenzarEmpieza gratis

Validating data loaded to a Postgres Database

En este ejercicio, por fin vas a construir una canalización de datos de extremo a extremo. Esta canalización extraerá las calificaciones de pruebas escolares de un archivo JSON y transformará los datos para eliminar las filas con calificaciones faltantes. Además, cada escuela se clasificará por la ciudad en la que se encuentra, según su puntuación total. Por último, el conjunto de datos transformado se almacenará en una base de datos Postgres.

Para darte ventaja, las funciones extract() y transform() ya están creadas y se usan como se muestra a continuación. Además, pandas se ha importado como pd. ¡Mucha suerte!

# Extract and clean the testing scores.
raw_testing_scores = extract("testing_scores.json")
cleaned_testing_scores = transform(raw_testing_scores)

Este ejercicio forma parte del curso

ETL and ELT con Python

Ver curso

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

def load(clean_data, con_engine):
	# Store the data in the schools database
    clean_data.____(
    	name="scores_by_city",
		con=con_engine,
		____="____",  # Make sure to replace existing data
		index=True,
		index_label="school_id"
    )
Editar y ejecutar código