Cargar datos en una base de datos Postgres
Después de extraer los datos de un sistema origen y transformarlos para alinearlos con casos de uso analíticos o de reporting, llega el momento de cargarlos en un medio de almacenamiento final. Guardar los datos limpios en una base de datos SQL facilita que los consumidores de datos puedan acceder a ellos y ejecutar consultas. En este ejemplo, practicarás cómo cargar datos limpios en una base de datos Postgres.
Se ha importado sqlalchemy, y pandas está disponible como pd. Las primeras filas del DataFrame cleaned_testing_scores se muestran a continuación:
street_address city math_score ... best_score
01M539 111 Columbia Street Manhattan 657.0 Math
02M545 350 Grand Street Manhattan 613.0 Math
01M292 220 Henry Street Manhattan 410.0 Math
Este ejercicio forma parte del curso
ETL y ELT en Python
Instrucciones del ejercicio
- Actualiza la cadena de conexión para escribir en la base de datos
schoolsy crea un objeto de conexión usandosqlalchemy. - Usa
pandaspara escribir el DataFramecleaned_testing_scoresen la tablascoresde la base de datosschools. - Si la tabla ya tiene datos, asegúrate de reemplazar los valores con el DataFrame actual.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Update the connection string, create the connection object to the schools database
db_engine = sqlalchemy.____("postgresql+psycopg2://repl:password@localhost:5432/____")
# Write the DataFrame to the scores table
cleaned_testing_scores.____(
name="____",
con=db_engine,
index=False,
if_exists="____"
)