BaşlayınÜcretsiz Başlayın

Sansürlü veriyi ön işleme

Sen bir deniz biyoloğusun ve dönen yunusların yaşam süresini inceliyorsun. Doğum ve ölüm tarihlerine ilişkin tarihsel verilere erişimin var. Bazı işaretlenen yunuslar suyun başka bir bölgesine göç etti ve laboratuvar onların izini kaybetti. Bazıları farklı bir sürüden göçmen ve kesin doğum tarihleri bilinmiyor. Bazı yunuslar ise hâlâ hayatta!

  • Doğum tarihi NaN ise yunus göçmendir.
  • Ölüm tarihi NaN ise yunus ya kaçmıştır ya da hayattadır.

DataFrame'in adı dolphin_df. Yunusun yaşam süresinin sansürlü olup olmadığını gösteren observed adlı yeni bir sütun oluşturmak için, check_observed fonksiyonunu uygun değerlerle doldur ve bu fonksiyonu dolphin_df üzerinde .apply() ile uygula.

pandas ve numpy sırasıyla pd ve np olarak yüklendi.

Bu egzersiz

Python ile Survival Analysis

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • Sansürlü bir veri noktası için 0, aksi durumda 1 döndüren bir check_observed fonksiyonu oluştur.
  • check_observed fonksiyonunu kullanarak observed adlı bir sansür bayrağı sütunu oluştur.
  • Konsolda observed sütununun ortalama değerini yazdır.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# Create a function to return 1 if observed 0 otherwise
def check_observed(row):
    if pd.isna(row['birth_date']):
        flag = ____
    elif pd.isna(row['death_date']):
        flag = ____
    else:
        flag = ____
    return ____
  
# Create a censorship flag column
dolphin_df[____] = dolphin_df.apply(____, axis=1)

# Print average of observed
print(np.average(____))
Kodu Düzenle ve Çalıştır