Memuat CSV ke dalam sebuah tabel
Sejauh ini Anda sudah sangat baik dalam menyisipkan data ke dalam tabel! Kini, Anda akan mempelajari cara memuat isi berkas CSV ke dalam sebuah tabel.
Salah satu caranya adalah membaca berkas CSV baris demi baris, membuat dictionary dari setiap baris, lalu menggunakan insert(), seperti yang Anda lakukan pada latihan sebelumnya.
Namun ada cara yang lebih cepat menggunakan pandas. Anda dapat membaca berkas CSV ke dalam sebuah DataFrame dengan fungsi read_csv() (fungsi ini seharusnya sudah familier bagi Anda, tetapi Anda dapat menjalankan help(pd.read_csv) di konsol untuk menyegarkan ingatan!). Kemudian, Anda dapat memanggil metode .to_sql() (docs) pada DataFrame untuk memuatnya ke dalam tabel SQL di sebuah basis data. Kolom-kolom pada DataFrame harus sesuai dengan kolom-kolom pada tabel SQL.
.to_sql() memiliki banyak parameter, tetapi pada latihan ini kita akan menggunakan yang berikut:
nameadalah nama tabel SQL (dalam bentuk string).conadalah koneksi ke basis data yang akan Anda gunakan untuk mengunggah data.if_existsmenentukan perilaku jika tabel sudah ada di basis data; nilai yang mungkin adalah"fail","replace", dan"append".index(TrueatauFalse) menentukan apakah indeks DataFrame akan ditulis sebagai kolom.
Dalam latihan ini, Anda akan mengunggah data dalam berkas census.csv ke tabel "census" yang sudah ada. connection ke basis data telah dibuat untuk Anda.
Latihan ini adalah bagian dari kursus
Pengantar Basis Data di Python
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# import pandas
import pandas as pd
# read census.csv into a DataFrame : census_df
census_df = pd.___(___, ___=___)
# rename the columns of the census DataFrame
census_df.columns = [___, ___, ___, 'pop2000', 'pop2008']