1. Nauka
  2. /
  3. Kursy
  4. /
  5. Wydajne programowanie z pandas

Connected

ćwiczenie

Identyfikowanie brakujących wartości

Zanim przystąpisz do uzupełniania brakujących wartości, musisz najpierw sprawdzić, czy w danych w ogóle takie istnieją – i jeśli tak, z której grupy pochodzą.

W tym samym zbiorze danych restaurant_data, który pojawił się w lekcji, pewien pracownik przez pomyłkę usunął informacje o napiwkach z 65 stolików. Pytanie brzmi: ile brakujących wpisów dotyczy stolików, przy których siedzieli palacze, a ile – stolików dla niepalących.

Twoim zadaniem jest pogrupowanie obu zbiorów danych według zmiennej smoker, policzenie liczby obecnych wartości, a następnie obliczenie różnicy.

Uzupełniamy dane o napiwkach wyłącznie w celach ćwiczeniowych. Z etycznego punktu widzenia nie należy imputować danych finansowych w prawdziwych projektach – może to być uznane za fałszerstwo.

Instrukcje

100 XP
  • Pogrupuj dane według statusu palenia.
  • Oblicz liczbę niepustych wartości w każdej grupie.
  • Wyświetl liczbę brakujących wartości w każdej grupie.