CommencerCommencer gratuitement

Chargement de données dans une base de données Postgres

Une fois que les données ont été extraites d'un système source et transformées pour s'aligner sur les cas d'utilisation analytiques ou de reporting, il est temps de charger les données sur un support de stockage final. Le stockage des données nettoyées dans une base de données SQL facilite l'accès des consommateurs de données et l'exécution de requêtes. Dans cet exemple, vous vous entraînerez à charger des données nettoyées dans une base de données Postgres.

sqlalchemy a été importé, et pandas est disponible en tant que pd. Les premières lignes du DataFrame cleaned_testing_scores sont présentées ci-dessous :

             street_address       city  math_score  ... best_score
01M539  111 Columbia Street  Manhattan       657.0      Math
02M545     350 Grand Street  Manhattan       613.0      Math
01M292     220 Henry Street  Manhattan       410.0      Math

Cet exercice fait partie du cours

ETL et ELT en Python

Afficher le cours

Instructions

  • Mettez à jour la chaîne de connexion pour écrire dans la base de données schools et créez un objet de connexion en utilisant sqlalchemy.
  • Utilisez pandas pour écrire le DataFrame cleaned_testing_scores dans le tableau scores de la base de données schools.
  • Si le tableau est déjà rempli de données, veillez à remplacer les valeurs par le DataFrame actuel.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Update the connection string, create the connection object to the schools database
db_engine = sqlalchemy.____("postgresql+psycopg2://repl:password@localhost:5432/____")

# Write the DataFrame to the scores table
cleaned_testing_scores.____(
	name="____",
	con=db_engine,
	index=False,
	if_exists="____"
)
Modifier et exécuter le code