ComenzarEmpieza gratis

Cargar datos en una base de datos Postgres

Una vez extraídos los datos de un sistema fuente y transformados para alinearlos con los casos de uso analítico o de elaboración de informes, llega el momento de cargar los datos en un medio de almacenamiento final. Almacenar los datos depurados en una base de datos SQL facilita a los consumidores de datos el acceso a ellos y la ejecución de consultas. En este ejemplo, practicarás la carga de datos depurados en una base de datos Postgres.

sqlalchemy y pandas está disponible como pd. A continuación se muestran las primeras filas del DataFrame cleaned_testing_scores:

             street_address       city  math_score  ... best_score
01M539  111 Columbia Street  Manhattan       657.0      Math
02M545     350 Grand Street  Manhattan       613.0      Math
01M292     220 Henry Street  Manhattan       410.0      Math

Este ejercicio forma parte del curso

ETL y ELT en Python

Ver curso

Instrucciones del ejercicio

  • Actualiza la cadena de conexión para escribir en la base de datos schools y crea un objeto de conexión utilizando sqlalchemy.
  • Utiliza pandas para escribir el DataFrame de cleaned_testing_scores en la tabla scores de la base de datos schools.
  • Si la tabla ya tiene datos, asegúrate de sustituir los valores por el DataFrame actual.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Update the connection string, create the connection object to the schools database
db_engine = sqlalchemy.____("postgresql+psycopg2://repl:password@localhost:5432/____")

# Write the DataFrame to the scores table
cleaned_testing_scores.____(
	name="____",
	con=db_engine,
	index=False,
	if_exists="____"
)
Editar y ejecutar código