1. Nauka
  2. /
  3. Kursy
  4. /
  5. Braki danych w Pythonie

Connected

ćwiczenie

Wypełnianie wartościami zastępczymi

Podobnie jak szukasz zależności między brakami danych w różnych kolumnach, ważne jest też sprawdzenie, czy istnieje związek między brakami a wartościami dostępnymi w innych kolumnach. Pomoże ci to zidentyfikować czynniki wpływające na brakowanie danych.

BMI vs Serum Insulin

Na powyższym wykresie widać, że brakujące wartości zmiennej Serum Insulin są rozłożone równomiernie w całym zakresie wartości BMI. Oznacza to jedynie, że nie ma między nimi żadnej zależności!

W tym ćwiczeniu napiszesz funkcję generującą wartości zastępcze, które posłużą do stworzenia powyższego wykresu punktowego (w następnym ćwiczeniu). Generowanie wartości zastępczych polega na przeskalowaniu losowych wartości do zakresu kolumny przy użyciu współczynnika skalowania oraz przesunięciu tych wartości.

Funkcja rand() została już zaimportowana z biblioteki numpy.random.

Instrukcje 1/4

undefined XP
    1
    2
    3
    4
  • Oblicz zakres kolumny, odejmując jej wartość minimalną od maksymalnej.