Eksik değerleri belirleme

Eksik değer atamaya başlamadan önceki ilk adım, verimizde eksik değer olup olmadığını ve varsa hangi gruplardan kaynaklandığını belirlemektir.

Derstekiyle aynı restaurant_data verisinde, bir çalışan yanlışlıkla 65 masada bırakılan bahşişleri sildi. Buradaki soru, eksik girişlerin kaç tanesinin sigara içenlerin bulunduğu masalardan ve kaç tanesinin sigara içmeyenlerin bulunduğu masalardan geldiğidir.

Görevin, her iki veri kümesini de smoker değişkenine göre gruplamak, mevcut (eksik olmayan) değerleri saymak ve ardından farkı hesaplamaktır.

Derste öğretilen kavramları pekiştirmen için bahşişleri imputasyon ile dolduruyoruz. Etik açıdan, gerçek hayatta finansal verileri imputasyonla doldurmamalısın; bu, hile olarak değerlendirilebilir.

Bu egzersiz, kursun bir parçasıdır

pandas ile Verimli Kod Yazma

Kursa Göz Atın

Egzersiz talimatları

Veriyi sigara içme durumuna göre grupla.
Her gruptaki eksik olmayan değerlerin sayısını hesapla.
Her gruptaki eksik değerlerin sayısını yazdır.

Uygulamalı etkileşimli egzersiz

Bu egzersizi bu örnek kodu tamamlayarak deneyin.

# Group both objects according to smoke condition
restaurant_nan_grouped = restaurant_nan.____(____)

# Store the number of present values
restaurant_nan_nval = restaurant_nan_grouped['tip'].____()

# Print the group-wise missing entries
print(restaurant_nan_grouped['total_bill'].count() - ____)

Kodu Düzenle ve Çalıştır