ComenzarEmpieza gratis

Validar los datos cargados en una base de datos Postgres

En este ejercicio, por fin podrás construir una canalización de datos de principio a fin. Esta canalización extraerá las puntuaciones de las pruebas escolares de un archivo JSON y transformará los datos para eliminar las filas con puntuaciones que falten. Además, cada uno se clasificará según la ciudad en la que se encuentre, en función de su puntuación total. Por último, el conjunto de datos transformado se almacenará en una base de datos Postgres.

Para que te hagas una idea, las funciones extract() y transform() se han construido y utilizado como se muestra a continuación. Además, pandas se ha importado como pd. ¡Mucha suerte!

# Extract and clean the testing scores.
raw_testing_scores = extract("testing_scores.json")
cleaned_testing_scores = transform(raw_testing_scores)

Este ejercicio forma parte del curso

ETL y ELT en Python

Ver curso

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

def load(clean_data, con_engine):
	# Store the data in the schools database
    clean_data.____(
    	name="scores_by_city",
		con=con_engine,
		____="____",  # Make sure to replace existing data
		index=True,
		index_label="school_id"
    )
Editar y ejecutar código