Cargar datos en una base de datos Postgres
Después de extraer los datos de un sistema origen y transformarlos para alinearlos con casos de uso analíticos o de reporting, llega el momento de cargarlos en un medio de almacenamiento final. Guardar los datos limpios en una base de datos SQL facilita que los consumidores de datos puedan acceder a ellos y ejecutar consultas. En este ejemplo, practicarás cómo cargar datos limpios en una base de datos Postgres.
Se ha importado sqlalchemy, y pandas está disponible como pd. Las primeras filas del DataFrame cleaned_testing_scores se muestran a continuación:
street_address city math_score ... best_score
01M539 111 Columbia Street Manhattan 657.0 Math
02M545 350 Grand Street Manhattan 613.0 Math
01M292 220 Henry Street Manhattan 410.0 Math
Este ejercicio forma parte del curso
ETL and ELT con Python
Instrucciones del ejercicio
- Actualiza la cadena de conexión para escribir en la base de datos
schoolsy crea un objeto de conexión usandosqlalchemy. - Usa
pandaspara escribir el DataFramecleaned_testing_scoresen la tablascoresde la base de datosschools. - Si la tabla ya tiene datos, asegúrate de reemplazar los valores con el DataFrame actual.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Update the connection string, create the connection object to the schools database
db_engine = sqlalchemy.____("postgresql+psycopg2://repl:password@localhost:5432/____")
# Write the DataFrame to the scores table
cleaned_testing_scores.____(
name="____",
con=db_engine,
index=False,
if_exists="____"
)