Erste SchritteKostenlos loslegen

Daten in eine Postgres-Datenbank laden

Nachdem die Daten aus einem Quellsystem extrahiert und so umgewandelt wurden, dass sie für Analyse- oder Berichtszwecke geeignet sind, ist es an der Zeit, die Daten auf ein endgültiges Speichermedium zu laden. Wenn du bereinigte Daten in einer SQL Datenbank speicherst, können Datenkonsumenten einfach darauf zugreifen und Abfragen durchführen. In diesem Beispiel übst du das Laden von bereinigten Daten in eine Postgres-Datenbank.

sqlalchemy wurde importiert, und pandas ist als pd verfügbar. Die ersten Zeilen des cleaned_testing_scores DataFrame werden unten angezeigt:

             street_address       city  math_score  ... best_score

01M539  111 Columbia Street  Manhattan       657.0      Math
02M545     350 Grand Street  Manhattan       613.0      Math
01M292     220 Henry Street  Manhattan       410.0      Math

Diese Übung ist Teil des Kurses

ETL und ELT in Python

Kurs anzeigen

Anleitung zur Übung

  • Aktualisiere die Verbindungszeichenfolge, um in die Datenbank schools zu schreiben, und erstelle ein Verbindungsobjekt mit sqlalchemy.
  • Verwende pandas, um den cleaned_testing_scores DataFrame in die Tabelle scores in der Datenbank schools zu schreiben.
  • Wenn die Tabelle bereits mit Daten gefüllt ist, stelle sicher, dass du die Werte durch den aktuellen DataFrame ersetzt.

Interaktive Übung zum Anfassen

Probieren Sie diese Übung aus, indem Sie diesen Beispielcode ausführen.

# Update the connection string, create the connection object to the schools database
db_engine = sqlalchemy.____("postgresql+psycopg2://repl:password@localhost:5432/____")

# Write the DataFrame to the scores_by_city table
cleaned_testing_scores.____(
	name="____",
	con=db_engine,
	index=False,
	if_exists="____"
)
Bearbeiten und Ausführen von Code