ComenzarEmpieza gratis

Cargar datos en una base de datos Postgres

Una vez extraídos los datos de un sistema fuente y transformados para alinearlos con los casos de uso analítico o de elaboración de informes, llega el momento de cargar los datos en un medio de almacenamiento final. Almacenar los datos depurados en una base de datos SQL facilita a los consumidores de datos el acceso a ellos y la ejecución de consultas. En este ejemplo, practicarás la carga de datos depurados en una base de datos Postgres.

sqlalchemy y pandas está disponible como pd. A continuación se muestran las primeras filas del DataFrame cleaned_testing_scores:

             street_address       city  math_score  ... best_score

01M539  111 Columbia Street  Manhattan       657.0      Math
02M545     350 Grand Street  Manhattan       613.0      Math
01M292     220 Henry Street  Manhattan       410.0      Math

Este ejercicio forma parte del curso

Introducción a las canalizaciones de datos

Ver curso

Instrucciones de ejercicio

  • Actualiza la cadena de conexión para escribir en la base de datos schools y crea un objeto de conexión utilizando sqlalchemy.
  • Utiliza pandas para escribir el marco de datos cleaned_testing_scores en la tabla scores de la base de datos schools.
  • Si la tabla ya está rellena con datos, asegúrate de sustituir los valores por los del DataFrame actual.

Ejercicio interactivo práctico

Pruebe este ejercicio completando este código de muestra.

# Update the connection string, create the connection object to the schools database
db_engine = sqlalchemy.____("postgresql+psycopg2://repl:password@localhost:5432/____")

# Write the DataFrame to the scores_by_city table
cleaned_testing_scores.____(
	name="____",
	con=db_engine,
	index=False,
	if_exists="____"
)
Editar y ejecutar código