Menemukan konsistensi
Dalam latihan ini dan sepanjang bab ini, Anda akan bekerja dengan DataFrame airlines yang berisi respons survei tentang Bandara San Francisco dari pelanggan maskapai.
DataFrame ini memuat metadata penerbangan seperti maskapai, tujuan, waktu tunggu, serta jawaban atas pertanyaan kunci mengenai kebersihan, keamanan, dan kepuasan. Sebuah DataFrame lain bernama categories telah dibuat, berisi semua nilai yang benar dan mungkin untuk kolom-kolom survei.
Dalam latihan ini, Anda akan menggunakan kedua DataFrame tersebut untuk menemukan jawaban survei dengan nilai yang tidak konsisten, lalu menghapusnya, secara efektif melakukan outer dan inner join pada kedua DataFrame seperti yang ditunjukkan dalam latihan video. Paket pandas telah diimpor sebagai pd, dan DataFrame airlines serta categories sudah tersedia di environment Anda.
Latihan ini adalah bagian dari kursus
Membersihkan Data di Python
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Print categories DataFrame
print(____)
# Print unique values of survey columns in airlines
print('Cleanliness: ', airlines['cleanliness'].____, "\n")
print('Safety: ', ____, "\n")
print('Satisfaction: ', ____, "\n")