Sansürlü veriyi ön işleme
Sen bir deniz biyoloğusun ve dönen yunusların yaşam süresini inceliyorsun. Doğum ve ölüm tarihlerine ilişkin tarihsel verilere erişimin var. Bazı işaretlenen yunuslar suyun başka bir bölgesine göç etti ve laboratuvar onların izini kaybetti. Bazıları farklı bir sürüden göçmen ve kesin doğum tarihleri bilinmiyor. Bazı yunuslar ise hâlâ hayatta!
- Doğum tarihi
NaNise yunus göçmendir. - Ölüm tarihi
NaNise yunus ya kaçmıştır ya da hayattadır.
DataFrame'in adı dolphin_df. Yunusun yaşam süresinin sansürlü olup olmadığını gösteren observed adlı yeni bir sütun oluşturmak için, check_observed fonksiyonunu uygun değerlerle doldur ve bu fonksiyonu dolphin_df üzerinde .apply() ile uygula.
pandas ve numpy sırasıyla pd ve np olarak yüklendi.
Bu egzersiz
Python ile Survival Analysis
kursunun bir parçasıdırEgzersiz talimatları
- Sansürlü bir veri noktası için
0, aksi durumda1döndüren bircheck_observedfonksiyonu oluştur. check_observedfonksiyonunu kullanarakobservedadlı bir sansür bayrağı sütunu oluştur.- Konsolda
observedsütununun ortalama değerini yazdır.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Create a function to return 1 if observed 0 otherwise
def check_observed(row):
if pd.isna(row['birth_date']):
flag = ____
elif pd.isna(row['death_date']):
flag = ____
else:
flag = ____
return ____
# Create a censorship flag column
dolphin_df[____] = dolphin_df.apply(____, axis=1)
# Print average of observed
print(np.average(____))