Daten in eine Postgres-Datenbank laden
Nachdem die Daten aus einem Quellsystem extrahiert und so umgewandelt wurden, dass sie für Analyse- oder Berichtszwecke geeignet sind, ist es an der Zeit, die Daten auf ein endgültiges Speichermedium zu laden. Wenn du bereinigte Daten in einer SQL Datenbank speicherst, können Datenkonsumenten einfach darauf zugreifen und Abfragen durchführen. In diesem Beispiel übst du das Laden von bereinigten Daten in eine Postgres-Datenbank.
sqlalchemy
wurde importiert, und pandas
ist als pd
verfügbar. Die ersten Zeilen des cleaned_testing_scores
DataFrame werden unten angezeigt:
street_address city math_score ... best_score
01M539 111 Columbia Street Manhattan 657.0 Math
02M545 350 Grand Street Manhattan 613.0 Math
01M292 220 Henry Street Manhattan 410.0 Math
Diese Übung ist Teil des Kurses
ETL und ELT in Python
Anleitung zur Übung
- Aktualisiere die Verbindungszeichenfolge, um in die Datenbank
schools
zu schreiben, und erstelle ein Verbindungsobjekt mitsqlalchemy
. - Verwende
pandas
, um dencleaned_testing_scores
DataFrame in die Tabellescores
in der Datenbankschools
zu schreiben. - Wenn die Tabelle bereits mit Daten gefüllt ist, stelle sicher, dass du die Werte durch den aktuellen DataFrame ersetzt.
Interaktive Übung zum Anfassen
Probieren Sie diese Übung aus, indem Sie diesen Beispielcode ausführen.
# Update the connection string, create the connection object to the schools database
db_engine = sqlalchemy.____("postgresql+psycopg2://repl:password@localhost:5432/____")
# Write the DataFrame to the scores_by_city table
cleaned_testing_scores.____(
name="____",
con=db_engine,
index=False,
if_exists="____"
)