Bekerja dengan banyak spreadsheet
Workbook yang ditujukan terutama untuk pembaca manusia, bukan mesin, bisa menyimpan data tentang satu subjek di beberapa sheet. Misalnya, sebuah file dapat memiliki sheet transaksi yang berbeda untuk setiap wilayah atau setiap tahun ketika sebuah bisnis beroperasi.
File FreeCodeCamp New Developer Survey disusun serupa, dengan sampel tanggapan dari tahun yang berbeda pada sheet yang berbeda. Tugas Anda di sini adalah menggabungkannya ke dalam satu dataframe untuk dianalisis.
pandas telah diimpor sebagai pd. Semua sheet telah dibaca ke dalam ordered dictionary responses, dengan nama sheet sebagai key dan dataframe sebagai value, sehingga Anda dapat mengambil dataframe dengan metode values().
Latihan ini adalah bagian dari kursus
Pemasukan Data yang Efisien dengan pandas
Petunjuk latihan
- Buat sebuah dataframe kosong,
all_responses. - Siapkan sebuah loop
foruntuk mengiterasi nilai dalam dictionaryresponses. - Konkatenasikan setiap dataframe ke
all_responsesdan tetapkan kembali hasilnya ke nama variabel yang sama.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Create an empty dataframe
all_responses = ____
# Set up for loop to iterate through values in responses
for df in ____:
# Print the number of rows being added
print("Adding {} rows".format(df.shape[0]))
# Concatenate all_responses and df, assign result
all_responses = pd.concat(____)
# Graph employment statuses in sample
counts = all_responses.groupby("EmploymentStatus").EmploymentStatus.count()
counts.plot.barh()
plt.show()