ComenzarEmpieza gratis

Validar los datos cargados en una base de datos Postgres

En este ejercicio, por fin podrás construir una canalización de datos de principio a fin. Esta canalización extraerá las puntuaciones de las pruebas escolares de un archivo JSON y transformará los datos para eliminar las filas con puntuaciones que falten. Además, cada uno se clasificará según la ciudad en la que se encuentre, en función de su puntuación total. Por último, el conjunto de datos transformado se almacenará en una base de datos Postgres.

Para que te hagas una idea, las funciones extract() y transform() se han construido y utilizado como se muestra a continuación. Además, pandas se ha importado como pd. ¡Mucha suerte!

# Extract and clean the testing scores.
raw_testing_scores = extract("testing_scores.json")
cleaned_testing_scores = transform(raw_testing_scores)

Este ejercicio forma parte del curso

Introducción a las canalizaciones de datos

Ver curso

Ejercicio interactivo práctico

Pruebe este ejercicio completando este código de muestra.

def load(clean_data, con_engine):
	# Store the data in the schools database
    clean_data.____(
    	name="scores_by_city",
		con=con_engine,
		____="____",  # Make sure to replace existing data
		index=True,
		index_label="school_id"
    )
Editar y ejecutar código