BaşlayınÜcretsiz Başlayın

Kategorileri yeniden eşleme

airlines içindeki anket katılımcılarını daha iyi anlamak için, belirli yanıtlarla haftanın günü ve kapıdaki bekleme süresi arasında bir ilişki olup olmadığını bulmak istiyorsun.

airlines DataFrame'i sırasıyla kategorik ve sayısal olan day ve wait_min sütunlarını içeriyor. day, bir uçuşun gerçekleştiği kesin günü; wait_min ise yolcuların kapıda beklediği dakika sayısını içerir. Analizini kolaylaştırmak için iki yeni kategorik değişken oluşturmak istiyorsun:

  • wait_type: 0-60 dk için 'short', 60-180 için 'medium', 180+ için long
  • day_week: gün hafta içindeyse 'weekday', hafta sonundaysa 'weekend'.

pandas ve numpy paketleri sırasıyla pd ve np olarak içe aktarılmış durumda. Hadi yeni kategorik veriler oluşturalım!

Bu egzersiz

Python ile Veri Temizleme

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • Açıklamada belirtilen wait_type sütunu için aralıkları ve etiketleri oluştur.
  • pd.cut() kullanarak, label_ranges ve label_names argümanlarını doğru yerlere vererek wait_min’den wait_type sütununu oluştur.
  • Hafta içi günlerini 'weekday'e, hafta sonu günlerini 'weekend'e eşleyen mapping sözlüğünü oluştur.
  • .replace() kullanarak day_week sütununu oluştur.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# Create ranges for categories
label_ranges = [0, 60, ____, np.inf]
label_names = ['short', ____, ____]

# Create wait_type column
airlines['wait_type'] = pd.____(____, bins = ____, 
                                labels = ____)

# Create mappings and replace
mappings = {'Monday':'weekday', 'Tuesday':'____', 'Wednesday': '____', 
            'Thursday': '____', '____': '____', 
            'Saturday': 'weekend', '____': '____'}

airlines['day_week'] = airlines['day'].____(mappings)
Kodu Düzenle ve Çalıştır