1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Modelování kreditního rizika v R

Connected

cvičení

Odstranění chybějících dat

Už víš, že úroková sazba (int_rate) v datasetu loan_data se liší podle zákazníka. Bohužel u některých záznamů úroková sazba chybí. Teď potřebuješ zjistit, kolik úrokových sazeb chybí, a tyto záznamy odstranit.

V tomto cvičení použiješ funkci which() k vytvoření indexu řádků, které obsahují hodnotu NA. Tento index pak použiješ k odstranění řádků s NA.

Pokyny

100 XP
  • Podívej se na počet chybějících hodnot proměnné int_rate pomocí funkce summary().
  • Pomocí which() a is.na() vytvoř index záznamů, u nichž není úroková sazba zaznamenána. Výsledek ulož do objektu na_index.
  • Vytvoř nový dataset s názvem loan_data_delrow_na, který nebude obsahovat záznamy s chybějícími úrokovými sazbami.
  • Připomeň si, že jsme vytvořili kopii loan_data s názvem loan_data_delcol_na. Místo odstranění záznamů s chybějícími úrokovými sazbami tentokrát smaž celý sloupec int_rate – nastav ho na NULL.