1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Dealing with Missing Data in Python

Connected

Cvičení

Vytvoření zástupných hodnot

Podobně jako jsi hledal/a vztahy mezi chybějícími hodnotami v různých sloupcích, je důležité zkoumat také vztah mezi chybějícími a nechybějícími hodnotami. Pomůže ti to odhalit faktory způsobující chybějící hodnoty v datech.

BMI vs Serum Insulin

Z grafu výše vidíš, že chybějící hodnoty Serum Insulin jsou rozloženy napříč celým rozsahem hodnot BMI. To naznačuje, že mezi nimi žádný vztah není!

V tomto cvičení napíšeš funkci pro generování zástupných hodnot, které poslouží k vytvoření výše zobrazeného bodového grafu (v příštím cvičení). Generování zástupných hodnot zahrnuje škálování náhodných hodnot na rozsah sloupce pomocí škálovacího faktoru a jejich posunutí.

Funkce rand() je již naimportována z numpy.random.

Pokyny 1/4

undefined XP
    1
    2
    3
    4
  • Vypočítej rozsah sloupce jako rozdíl jeho maximální a minimální hodnoty.