1. Nauka
  2. /
  3. Kursy
  4. /
  5. Braki danych w Pythonie

Connected

ćwiczenie

Czy usunąć dane?

Zanim całkowicie usuniesz brakujące wartości, musisz wziąć pod uwagę kilka czynników. Najprostszym z nich jest rozmiar brakujących danych. Bardziej złożone przyczyny braków mogą wymagać wiedzy dziedzinowej. W tym ćwiczeniu zidentyfikujesz powód braku danych, a następnie przeprowadzisz odpowiednie usuwanie.

Na początku skorzystasz z msno.matrix() oraz msno.heatmap(), aby zwizualizować braki danych i korelacje między zmiennymi z brakującymi wartościami. Następnie określisz wzorzec braków. Na koniec usuniesz dane w zależności od rodzaju brakujących wartości.

DataFrame diabetes został już wczytany.

Zamiast plt.show() użyto własnościowej funkcji display(), aby ułatwić podgląd wyników.

Instrukcje 1/4

undefined XP
    1
    2
    3
    4
  • Zwizualizuj macierz braków danych dla zbioru diabetes.