Carregamento de dados em um banco de dados Postgres
Depois que os dados forem extraídos de um sistema de origem e transformados para se alinharem aos casos de uso de análises ou relatórios, é hora de carregar os dados em uma mídia de armazenamento final. O armazenamento de dados limpos em um banco de dados SQL simplifica o acesso e a execução de consultas pelos consumidores de dados. Neste exemplo, você praticará o carregamento de dados limpos em um banco de dados Postgres.
sqlalchemy foi importado, e pandas está disponível como pd. As primeiras linhas do DataFrame cleaned_testing_scores são mostradas abaixo:
street_address city math_score ... best_score
01M539 111 Columbia Street Manhattan 657.0 Math
02M545 350 Grand Street Manhattan 613.0 Math
01M292 220 Henry Street Manhattan 410.0 Math
Este exercício faz parte do curso
ETL and ELT em Python
Instruções do exercício
- Atualize a string de conexão para gravar no banco de dados
schoolse crie um objeto de conexão usandosqlalchemy. - Use
pandaspara gravar o DataFramecleaned_testing_scoresna tabelascoresno banco de dadosschools. - Se a tabela já estiver preenchida com dados, certifique-se de substituir os valores pelo DataFrame atual.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Update the connection string, create the connection object to the schools database
db_engine = sqlalchemy.____("postgresql+psycopg2://repl:password@localhost:5432/____")
# Write the DataFrame to the scores table
cleaned_testing_scores.____(
name="____",
con=db_engine,
index=False,
if_exists="____"
)