Cargar datos en una base de datos Postgres
Una vez extraídos los datos de un sistema fuente y transformados para alinearlos con los casos de uso analítico o de elaboración de informes, llega el momento de cargar los datos en un medio de almacenamiento final. Almacenar los datos depurados en una base de datos SQL facilita a los consumidores de datos el acceso a ellos y la ejecución de consultas. En este ejemplo, practicarás la carga de datos depurados en una base de datos Postgres.
sqlalchemy
y pandas
está disponible como pd
. A continuación se muestran las primeras filas del DataFrame cleaned_testing_scores
:
street_address city math_score ... best_score
01M539 111 Columbia Street Manhattan 657.0 Math
02M545 350 Grand Street Manhattan 613.0 Math
01M292 220 Henry Street Manhattan 410.0 Math
Este ejercicio forma parte del curso
Introducción a las canalizaciones de datos
Instrucciones de ejercicio
- Actualiza la cadena de conexión para escribir en la base de datos
schools
y crea un objeto de conexión utilizandosqlalchemy
. - Utiliza
pandas
para escribir el marco de datoscleaned_testing_scores
en la tablascores
de la base de datosschools
. - Si la tabla ya está rellena con datos, asegúrate de sustituir los valores por los del DataFrame actual.
Ejercicio interactivo práctico
Pruebe este ejercicio completando este código de muestra.
# Update the connection string, create the connection object to the schools database
db_engine = sqlalchemy.____("postgresql+psycopg2://repl:password@localhost:5432/____")
# Write the DataFrame to the scores_by_city table
cleaned_testing_scores.____(
name="____",
con=db_engine,
index=False,
if_exists="____"
)