Menggabungkan dataframe
Pada latihan sebelumnya, Anda membuat himpunan data berisi 100 kafe terbaik di New York City menurut Yelp. Sekarang, Anda akan menggabungkannya dengan data demografi untuk menyelidiki kawasan mana yang memiliki kafe bagus terbanyak per kapita.
Untuk melakukan ini, Anda akan menggabungkan dua himpunan data dengan metode DataFrame merge(). Pertama, crosswalk, yaitu pemetaan antara kode ZIP dan Public Use Micro Data Sample Areas (PUMA), yang merupakan agregat dari blok sensus dan kira-kira sesuai dengan kawasan di NYC. Lalu, Anda akan menggabungkan pop_data, yang memuat estimasi populasi tahun 2016 untuk setiap PUMA.
pandas (sebagai pd) telah diimpor, begitu juga dataframe cafes dari latihan sebelumnya.
Latihan ini adalah bagian dari kursus
Pemasukan Data yang Efisien dengan pandas
Latihan interaktif praktis
Ubah teori menjadi tindakan dengan salah satu latihan interaktif kami.
Mulai berolahraga