Caricare i dati in un database Postgres
Dopo aver estratto i dati da un sistema sorgente e averli trasformati per allinearli ai casi d’uso di analytics o reportistica, è il momento di caricarli nel sistema di archiviazione finale. Salvare i dati puliti in un database SQL rende semplice l’accesso e l’esecuzione di query per chi ne usufruisce. In questo esercizio, metterai in pratica il caricamento di dati puliti in un database Postgres.
sqlalchemy è stato importato e pandas è disponibile come pd. Le prime righe del DataFrame cleaned_testing_scores sono mostrate qui sotto:
street_address city math_score ... best_score
01M539 111 Columbia Street Manhattan 657.0 Math
02M545 350 Grand Street Manhattan 613.0 Math
01M292 220 Henry Street Manhattan 410.0 Math
Questo esercizio fa parte del corso
ETL and ELT in Python
Istruzioni dell'esercizio
- Aggiorna la stringa di connessione per scrivere nel database
schoolse crea un oggetto di connessione usandosqlalchemy. - Usa
pandasper scrivere il DataFramecleaned_testing_scoresnella tabellascoresdel databaseschools. - Se la tabella è già popolata, assicurati di sostituire i valori con quelli dell’attuale DataFrame.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Update the connection string, create the connection object to the schools database
db_engine = sqlalchemy.____("postgresql+psycopg2://repl:password@localhost:5432/____")
# Write the DataFrame to the scores table
cleaned_testing_scores.____(
name="____",
con=db_engine,
index=False,
if_exists="____"
)