Memuat sebagian dari spreadsheet
Spreadsheet yang ditujukan untuk dibaca manusia sering memiliki beberapa tabel; misalnya, sebuah usaha kecil mungkin menyimpan buku kerja inventaris dengan tabel untuk berbagai jenis produk pada satu sheet. Bahkan data bertabel dapat memiliki baris header berisi metadata, seperti data New Developer Survey di sini. Walau metadata bermanfaat, kita tidak menginginkannya di dalam dataframe. Anda akan menggunakan keyword skiprows dari read_excel() untuk mengambil hanya datanya. Anda juga akan membuat sebuah string untuk diberikan ke usecols agar hanya mengambil kolom AD serta AW hingga BA, yang membahas tujuan pekerjaan di masa depan.
pandas telah diimpor sebagai pd.
Latihan ini adalah bagian dari kursus
Pemasukan Data yang Efisien dengan pandas
Petunjuk latihan
- Buat sebuah string tunggal,
col_string, yang menyatakan bahwapandasharus memuat kolomADdan juga rentangAWsampaiBA. - Muat
fcc_survey_headers.xlsx', aturskiprowsdanusecolsuntuk melewati dua baris metadata pertama dan hanya mengambil kolom-kolom dalamcol_string. - Lihat nama kolom yang terpilih pada dataframe hasilnya.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Create string of lettered columns to load
col_string = ____
# Load data with skiprows and usecols set
survey_responses = ____("fcc_survey_headers.xlsx",
____,
____)
# View the names of the columns selected
print(survey_responses.columns)