1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Čištění dat v R

Connected

cvičení

Odhalování nekonzistencí

Ve videoukázce ses seznámil/a s různými druhy nekonzistencí, které se mohou vyskytovat v kategoriálních proměnných – díky nim může vypadat, že proměnná má více kategorií, než by měla.

V tomto cvičení budeš dál pracovat s datasetem sfo_survey. Prozkoumáš sloupec dest_size a také sloupec cleanliness a zjistíš, s jakými problémy – pokud vůbec nějakými – se tyto dvě kategoriální proměnné potýkají.

dplyr je načtený a sfo_survey je k dispozici.

Pokyny 1/4

undefined XP
    1
    2
    3
    4
  • Spočítej počet výskytů každé kategorie proměnné dest_size z datasetu sfo_survey.