1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Dealing with Missing Data in Python

Connected

cvičení

Nahrazování skrytých chybějících hodnot

V předchozích dvou cvičeních jsi pracoval/a s identifikací a zpracováním chybějících hodnot při načítání datové sady. V tomto cvičení se zaměříš na odhalování skrytých chybějících hodnot v datech a jejich zpracování. Použiješ k tomu datovou sadu diabetes, která je už načtená.

DataFrame diabetes obsahuje ve sloupci BMI nuly. Jenže BMI nemůže být 0 — místo toho by tam mělo být NaN. V tomto cvičení se naučíš takové nesrovnalosti odhalovat. Provedeš jednoduchou analýzu dat, zachytíš chybějící hodnoty a nahradíš je. Knihovny numpy a pandas jsou již naimportované jako np a pd.

Datovou sadu si také můžeš volně prozkoumat — zkus například vypsat .head(), .info() a podobně, ať se s ní lépe seznámíš.

Pokyny 1/4

undefined XP
    1
    2
    3
    4
  • Zobraz základní statistiky datové sady diabetes.