Cargar datos en una base de datos Postgres
Una vez extraídos los datos de un sistema fuente y transformados para alinearlos con los casos de uso analítico o de elaboración de informes, llega el momento de cargar los datos en un medio de almacenamiento final. Almacenar los datos depurados en una base de datos SQL facilita a los consumidores de datos el acceso a ellos y la ejecución de consultas. En este ejemplo, practicarás la carga de datos depurados en una base de datos Postgres.
sqlalchemy
y pandas
está disponible como pd
. A continuación se muestran las primeras filas del DataFrame cleaned_testing_scores
:
street_address city math_score ... best_score
01M539 111 Columbia Street Manhattan 657.0 Math
02M545 350 Grand Street Manhattan 613.0 Math
01M292 220 Henry Street Manhattan 410.0 Math
Este ejercicio forma parte del curso
ETL y ELT en Python
Instrucciones del ejercicio
- Actualiza la cadena de conexión para escribir en la base de datos
schools
y crea un objeto de conexión utilizandosqlalchemy
. - Utiliza
pandas
para escribir el DataFrame decleaned_testing_scores
en la tablascores
de la base de datosschools
. - Si la tabla ya tiene datos, asegúrate de sustituir los valores por el DataFrame actual.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Update the connection string, create the connection object to the schools database
db_engine = sqlalchemy.____("postgresql+psycopg2://repl:password@localhost:5432/____")
# Write the DataFrame to the scores table
cleaned_testing_scores.____(
name="____",
con=db_engine,
index=False,
if_exists="____"
)