Veriyi bir Postgres veritabanına yükleme
Veri bir kaynak sistemden çıkarılıp analitik ya da raporlama kullanım senaryolarına uyacak şekilde dönüştürüldükten sonra, artık veriyi son bir depolama ortamına yükleme zamanı gelir. Temizlenmiş veriyi bir SQL veritabanında saklamak, veri tüketicilerinin kolayca erişip sorgu çalıştırmasını sağlar. Bu örnekte, temizlenmiş veriyi bir Postgres veritabanına yüklemeyi pratik edeceksin.
sqlalchemy içe aktarılmış durumda ve pandas pd olarak mevcut. cleaned_testing_scores DataFrame’inin ilk birkaç satırı aşağıda gösterilmiştir:
street_address city math_score ... best_score
01M539 111 Columbia Street Manhattan 657.0 Math
02M545 350 Grand Street Manhattan 613.0 Math
01M292 220 Henry Street Manhattan 410.0 Math
Bu egzersiz
Python ile ETL ve ELT
kursunun bir parçasıdırEgzersiz talimatları
- Bağlantı dizesini
schoolsveritabanına yazacak şekilde güncelle vesqlalchemykullanarak bir bağlantı nesnesi oluştur. pandasilecleaned_testing_scoresDataFrame’inischoolsveritabanındakiscorestablosuna yaz.- Tablo zaten veri içeriyorsa, değerleri mevcut DataFrame ile değiştirdiğinden emin ol.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Update the connection string, create the connection object to the schools database
db_engine = sqlalchemy.____("postgresql+psycopg2://repl:password@localhost:5432/____")
# Write the DataFrame to the scores table
cleaned_testing_scores.____(
name="____",
con=db_engine,
index=False,
if_exists="____"
)