Kategorileri yeniden eşleme
airlines içindeki anket katılımcılarını daha iyi anlamak için, belirli yanıtlarla haftanın günü ve kapıdaki bekleme süresi arasında bir ilişki olup olmadığını bulmak istiyorsun.
airlines DataFrame'i sırasıyla kategorik ve sayısal olan day ve wait_min sütunlarını içeriyor. day, bir uçuşun gerçekleştiği kesin günü; wait_min ise yolcuların kapıda beklediği dakika sayısını içerir. Analizini kolaylaştırmak için iki yeni kategorik değişken oluşturmak istiyorsun:
wait_type: 0-60 dk için'short', 60-180 için'medium', 180+ içinlongday_week: gün hafta içindeyse'weekday', hafta sonundaysa'weekend'.
pandas ve numpy paketleri sırasıyla pd ve np olarak içe aktarılmış durumda. Hadi yeni kategorik veriler oluşturalım!
Bu egzersiz
Python ile Veri Temizleme
kursunun bir parçasıdırEgzersiz talimatları
- Açıklamada belirtilen
wait_typesütunu için aralıkları ve etiketleri oluştur. pd.cut()kullanarak,label_rangesvelabel_namesargümanlarını doğru yerlere vererekwait_min’denwait_typesütununu oluştur.- Hafta içi günlerini
'weekday'e, hafta sonu günlerini'weekend'e eşleyenmappingsözlüğünü oluştur. .replace()kullanarakday_weeksütununu oluştur.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Create ranges for categories
label_ranges = [0, 60, ____, np.inf]
label_names = ['short', ____, ____]
# Create wait_type column
airlines['wait_type'] = pd.____(____, bins = ____,
labels = ____)
# Create mappings and replace
mappings = {'Monday':'weekday', 'Tuesday':'____', 'Wednesday': '____',
'Thursday': '____', '____': '____',
'Saturday': 'weekend', '____': '____'}
airlines['day_week'] = airlines['day'].____(mappings)