Memuat data ke database Postgres
Setelah data diekstrak dari sistem sumber dan ditransformasikan agar selaras dengan kasus penggunaan analitik atau pelaporan, saatnya memuat data ke media penyimpanan akhir. Menyimpan data bersih di database SQL memudahkan konsumen data untuk mengakses dan menjalankan kueri. Pada contoh ini, Anda akan berlatih memuat data yang telah dibersihkan ke database Postgres.
sqlalchemy telah diimpor, dan pandas tersedia sebagai pd. Beberapa baris pertama dari DataFrame cleaned_testing_scores ditunjukkan di bawah ini:
street_address city math_score ... best_score
01M539 111 Columbia Street Manhattan 657.0 Math
02M545 350 Grand Street Manhattan 613.0 Math
01M292 220 Henry Street Manhattan 410.0 Math
Latihan ini adalah bagian dari kursus
ETL dan ELT di Python
Petunjuk latihan
- Perbarui string koneksi untuk menulis ke database
schoolsdan buat objek koneksi menggunakansqlalchemy. - Gunakan
pandasuntuk menulis DataFramecleaned_testing_scoreske tabelscoresdi databaseschools. - Jika tabel sudah terisi data, pastikan untuk mengganti nilainya dengan DataFrame saat ini.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Update the connection string, create the connection object to the schools database
db_engine = sqlalchemy.____("postgresql+psycopg2://repl:password@localhost:5432/____")
# Write the DataFrame to the scores table
cleaned_testing_scores.____(
name="____",
con=db_engine,
index=False,
if_exists="____"
)