1. Učit se
  2. /
  3. Kurzy
  4. /
  5. R pro uživatele SAS

Connected

cvičení

Prozkoumání proměnných

Teď, když jsme do abaloneMod přidali několik nových proměnných, se v následující sérii cvičení zaměříme na kvalitu dat pomocí souhrnných statistik a grafické vizualizace.

Pomocí funkce dplyr::filter() také odfiltrujeme záznamy (řádky v datasetu abaloneMod), které obsahují chyby nebo logicky nesprávné hodnoty. Například u několika jedinců je uvedena height (výška) 0 mm, což je nesprávná hodnota způsobená pravděpodobně překlepem nebo chybou při měření.

Dataset abaloneMod je už načtený spolu s balíčky dplyr a ggplot2. Po odfiltrování chybných záznamů vytvoříš novou upravenou kopii datasetu nazvanou abaloneKeep, která bude obsahovat finální záznamy připravené k analýze v dalších lekcích.

Pokyny

100 XP
  • Získej souhrnné statistiky pro výšky (heights) plžů abalone.
  • Ponech záznamy s výškou větší než 0 a ulož je do nového dataframu abaloneKeep.
  • Pro záznamy v abaloneKeep vytvoř histogram výšek — všechny hodnoty by teď měly být větší než 0.