Menambahkan kategori durasi
Sekarang setelah Anda menyiapkan kategori dan nilai yang ingin ditangkap, saatnya membangun kolom baru untuk menganalisis frekuensi penerbangan berdasarkan durasi!
Variabel flight_categories, short_flights, medium_flights, dan long_flights yang sebelumnya Anda buat sudah tersedia.
Selain itu, paket berikut telah diimpor: pandas sebagai pd, numpy sebagai np, seaborn sebagai sns, dan matplotlib.pyplot sebagai plt.
Latihan ini adalah bagian dari kursus
Analisis Data Eksploratif di Python
Petunjuk latihan
- Buat
conditions, sebuah daftar yang berisi subsetplanes["Duration"]berdasarkanshort_flights,medium_flights, danlong_flights. - Buat kolom
"Duration_Category"dengan memanggil sebuah fungsi yang menerima daftarconditionsdanflight_categories, serta menetapkan nilai yang tidak ditemukan menjadi"Extreme duration". - Buat plot yang menampilkan jumlah untuk setiap kategori.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Create conditions for values in flight_categories to be created
conditions = [
(planes["____"].____.____(____)),
(planes["____"].____.____(____)),
(planes["____"].____.____(____))
]
# Apply the conditions list to the flight_categories
planes["Duration_Category"] = ____.____(____,
____,
default="____")
# Plot the counts of each category
sns.____(data=____, x="____")
plt.show()