ComeçarComece de graça

Carregamento de dados em um banco de dados Postgres

Depois que os dados forem extraídos de um sistema de origem e transformados para se alinharem aos casos de uso de análises ou relatórios, é hora de carregar os dados em uma mídia de armazenamento final. O armazenamento de dados limpos em um banco de dados SQL simplifica o acesso e a execução de consultas pelos consumidores de dados. Neste exemplo, você praticará o carregamento de dados limpos em um banco de dados Postgres.

sqlalchemy foi importado, e pandas está disponível como pd. As primeiras linhas do DataFrame cleaned_testing_scores são mostradas abaixo:

             street_address       city  math_score  ... best_score

01M539  111 Columbia Street  Manhattan       657.0      Math
02M545     350 Grand Street  Manhattan       613.0      Math
01M292     220 Henry Street  Manhattan       410.0      Math

Este exercício faz parte do curso

ETL and ELT em Python

Ver curso

Instruções do exercício

  • Atualize a string de conexão para gravar no banco de dados schools e crie um objeto de conexão usando sqlalchemy.
  • Use pandas para gravar o DataFrame cleaned_testing_scores na tabela scores no banco de dados schools.
  • Se a tabela já estiver preenchida com dados, certifique-se de substituir os valores pelo DataFrame atual.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Update the connection string, create the connection object to the schools database
db_engine = sqlalchemy.____("postgresql+psycopg2://repl:password@localhost:5432/____")

# Write the DataFrame to the scores table
cleaned_testing_scores.____(
	name="____",
	con=db_engine,
	index=False,
	if_exists="____"
)
Editar e executar o código