Chargement de données dans une base de données Postgres
Une fois que les données ont été extraites d'un système source et transformées pour s'aligner sur les cas d'utilisation analytiques ou de reporting, il est temps de charger les données sur un support de stockage final. Le stockage des données nettoyées dans une base de données SQL facilite l'accès des consommateurs de données et l'exécution de requêtes. Dans cet exemple, vous vous entraînerez à charger des données nettoyées dans une base de données Postgres.
sqlalchemy
a été importé, et pandas
est disponible en tant que pd
. Les premières lignes du DataFrame cleaned_testing_scores
sont présentées ci-dessous :
street_address city math_score ... best_score
01M539 111 Columbia Street Manhattan 657.0 Math
02M545 350 Grand Street Manhattan 613.0 Math
01M292 220 Henry Street Manhattan 410.0 Math
Cet exercice fait partie du cours
ETL et ELT en Python
Instructions
- Mettez à jour la chaîne de connexion pour écrire dans la base de données
schools
et créez un objet de connexion en utilisantsqlalchemy
. - Utilisez
pandas
pour écrire le DataFramecleaned_testing_scores
dans le tableauscores
de la base de donnéesschools
. - Si le tableau est déjà rempli de données, veillez à remplacer les valeurs par le DataFrame actuel.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Update the connection string, create the connection object to the schools database
db_engine = sqlalchemy.____("postgresql+psycopg2://repl:password@localhost:5432/____")
# Write the DataFrame to the scores table
cleaned_testing_scores.____(
name="____",
con=db_engine,
index=False,
if_exists="____"
)