Serangan kombo!
Anda telah melihat empat jenis manipulasi data yang paling umum: mengurutkan baris, melakukan subset pada kolom, melakukan subset baris, dan menambahkan kolom baru. Dalam analisis data nyata, Anda dapat mengombinasikan keempat manipulasi ini untuk menjawab berbagai pertanyaan.
Pada latihan ini, Anda akan menjawab pertanyaan, "Negara bagian mana yang memiliki jumlah individu tunawisma tertinggi per 10.000 penduduk di negara bagian tersebut?" Gunakan keterampilan pandas baru Anda untuk mengetahuinya.
Latihan ini adalah bagian dari kursus
Manipulasi Data dengan pandas
Petunjuk latihan
- Tambahkan kolom ke
homelessness,indiv_per_10k, yang berisi jumlah individu tunawisma per sepuluh ribu penduduk di setiap negara bagian, dengan menggunakanstate_popsebagai populasi negara bagian. - Melakukan subset baris di
indiv_per_10klebih tinggi dari20, simpan sebagaihigh_homelessness. - Urutkan
high_homelessnessberdasarkanindiv_per_10kmenurun, simpan sebagaihigh_homelessness_srt. - Pilih hanya kolom
statedanindiv_per_10kdarihigh_homelessness_srtdan simpan sebagairesult. Lihatresult.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Create indiv_per_10k col as homeless individuals per 10k state pop
homelessness["indiv_per_10k"] = 10000 * ____ / ____
# Subset rows for indiv_per_10k greater than 20
high_homelessness = ____
# Sort high_homelessness by descending indiv_per_10k
high_homelessness_srt = ____
# From high_homelessness_srt, select the state and indiv_per_10k cols
result = ____
# See the result
print(result)