Eksik değerleri belirleme
Eksik değer atamaya başlamadan önceki ilk adım, verimizde eksik değer olup olmadığını ve varsa hangi gruplardan kaynaklandığını belirlemektir.
Derstekiyle aynı restaurant_data verisinde, bir çalışan yanlışlıkla 65 masada bırakılan bahşişleri sildi. Buradaki soru, eksik girişlerin kaç tanesinin sigara içenlerin bulunduğu masalardan ve kaç tanesinin sigara içmeyenlerin bulunduğu masalardan geldiğidir.
Görevin, her iki veri kümesini de smoker değişkenine göre gruplamak, mevcut (eksik olmayan) değerleri saymak ve ardından farkı hesaplamaktır.
Derste öğretilen kavramları pekiştirmen için bahşişleri imputasyon ile dolduruyoruz. Etik açıdan, gerçek hayatta finansal verileri imputasyonla doldurmamalısın; bu, hile olarak değerlendirilebilir.
Bu egzersiz
pandas ile Verimli Kod Yazma
kursunun bir parçasıdırEgzersiz talimatları
- Veriyi sigara içme durumuna göre grupla.
- Her gruptaki eksik olmayan değerlerin sayısını hesapla.
- Her gruptaki eksik değerlerin sayısını yazdır.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Group both objects according to smoke condition
restaurant_nan_grouped = restaurant_nan.____(____)
# Store the number of present values
restaurant_nan_nval = restaurant_nan_grouped['tip'].____()
# Print the group-wise missing entries
print(restaurant_nan_grouped['total_bill'].count() - ____)