Carregamento de dados em um banco de dados Postgres
Depois que os dados forem extraídos de um sistema de origem e transformados para se alinharem aos casos de uso de análises ou relatórios, é hora de carregar os dados em uma mídia de armazenamento final. O armazenamento de dados limpos em um banco de dados SQL simplifica o acesso e a execução de consultas pelos consumidores de dados. Neste exemplo, você praticará o carregamento de dados limpos em um banco de dados Postgres.
sqlalchemy
foi importado, e pandas
está disponível como pd
. As primeiras linhas do DataFrame cleaned_testing_scores
são mostradas abaixo:
street_address city math_score ... best_score
01M539 111 Columbia Street Manhattan 657.0 Math
02M545 350 Grand Street Manhattan 613.0 Math
01M292 220 Henry Street Manhattan 410.0 Math
Este exercício faz parte do curso
ETL e ELT em Python
Instruções de exercício
- Atualize a string de conexão para gravar no banco de dados
schools
e crie um objeto de conexão usandosqlalchemy
. - Use
pandas
para gravar o DataFramecleaned_testing_scores
na tabelascores
no banco de dadosschools
. - Se a tabela já estiver preenchida com dados, certifique-se de substituir os valores pelo DataFrame atual.
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
# Update the connection string, create the connection object to the schools database
db_engine = sqlalchemy.____("postgresql+psycopg2://repl:password@localhost:5432/____")
# Write the DataFrame to the scores_by_city table
cleaned_testing_scores.____(
name="____",
con=db_engine,
index=False,
if_exists="____"
)