1. Nauka
  2. /
  3. Kursy
  4. /
  5. Ćwiczenie pytań na rozmowach kwalifikacyjnych z programowania w Pythonie

Connected

ćwiczenie

Imputacja wartości NaN

Spróbujmy zaimputować brakujące wartości, korzystając z metody .transform(). W poprzednim zadaniu utworzyłeś/-aś DataFrame fheroes, z którego usunięto wszystkie grupy z niewystarczającą liczbą obserwacji bmi. Kolumna bmi zawiera jednak wiele brakujących wartości (NaN). Masz do dyspozycji dwie kopie DataFrame fheroes (imp_globmean i imp_grpmean). Twoim zadaniem jest zaimputowanie wartości NaN w kolumnie bmi – odpowiednio: ogólną średnią oraz średnią dla każdej grupy zdefiniowanej przez czynniki Publisher i Alignment.

Wskazówka: obiekty pandas Series oraz tablice NumPy mają specjalną metodę .fillna(), która zastępuje wszystkie napotkane wartości NaN wartością podaną jako argument.

Instrukcje

100 XP
  • Zdefiniuj funkcję lambda, która imputuje wartości NaN w series jej średnią.
  • Zaimputuj wartości NaN w kolumnie bmi obiektu imp_globmean, używając ogólnej średniej.
  • Zaimputuj wartości NaN w kolumnie bmi obiektu imp_grpmean, używając średniej dla każdej grupy.