ComeçarComece gratuitamente

Carregamento de dados em um banco de dados Postgres

Depois que os dados forem extraídos de um sistema de origem e transformados para se alinharem aos casos de uso de análises ou relatórios, é hora de carregar os dados em uma mídia de armazenamento final. O armazenamento de dados limpos em um banco de dados SQL simplifica o acesso e a execução de consultas pelos consumidores de dados. Neste exemplo, você praticará o carregamento de dados limpos em um banco de dados Postgres.

sqlalchemy foi importado, e pandas está disponível como pd. As primeiras linhas do DataFrame cleaned_testing_scores são mostradas abaixo:

             street_address       city  math_score  ... best_score

01M539  111 Columbia Street  Manhattan       657.0      Math
02M545     350 Grand Street  Manhattan       613.0      Math
01M292     220 Henry Street  Manhattan       410.0      Math

Este exercício faz parte do curso

ETL e ELT em Python

Ver Curso

Instruções de exercício

  • Atualize a string de conexão para gravar no banco de dados schools e crie um objeto de conexão usando sqlalchemy.
  • Use pandas para gravar o DataFrame cleaned_testing_scores na tabela scores no banco de dados schools.
  • Se a tabela já estiver preenchida com dados, certifique-se de substituir os valores pelo DataFrame atual.

Exercício interativo prático

Experimente este exercício preenchendo este código de exemplo.

# Update the connection string, create the connection object to the schools database
db_engine = sqlalchemy.____("postgresql+psycopg2://repl:password@localhost:5432/____")

# Write the DataFrame to the scores_by_city table
cleaned_testing_scores.____(
	name="____",
	con=db_engine,
	index=False,
	if_exists="____"
)
Editar e executar código