1. Nauka
  2. /
  3. Kursy
  4. /
  5. Braki danych w Pythonie

Connected

ćwiczenie

Generowanie wykresu rozrzutu z uwzględnieniem braków danych

W tym ćwiczeniu utworzysz wykres rozrzutu zawierający zarówno wartości brakujące, jak i obecne. Wykorzystasz funkcję fill_dummy_values(), którą napisano w poprzednim ćwiczeniu, do wypełnienia wartości zastępczych w ramce danych diabetes_dummy.

Brakowość kolumny wyznaczamy za pomocą metody .isnull(), która zwraca obiekt pd.Series zawierający wartości True lub False.

Aby przypisać różne kolory do wartości brakujących i obecnych, wystarczy połączyć brakowości operacją LUB (|) na kolumnach uwzględnianych na wykresie. W rezultacie:

  • True \(\rightarrow\) co najmniej jedna z wartości col1 lub col2 jest brakująca.
  • False \(\rightarrow\) żadna z wartości col1 ani col2 nie jest brakująca.

Ramka danych diabetes oraz funkcja fill_dummy_values() są już wczytane i gotowe do użycia.

Instrukcje

100 XP
  • Zastosuj operację LUB, aby połączyć brakowość kolumn Skin_Fold i BMI.
  • Wypełnij wartości zastępcze w diabetes_dummy za pomocą funkcji fill_dummy_values().
  • Utwórz wykres rozrzutu 'BMI' względem 'Skin_Fold'; pamiętaj, że zapis Y względem X oznacza, że Y jest na osi pionowej, a X na osi poziomej, czyli Y jest funkcją X.