1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Čištění dat v R

Connected

cvičení

Omezení délky výpůjčky

Hodnoty mimo povolený rozsah mohou zkreslovat výsledky analýzy, proto je důležité je zachytit co nejdříve. V tomto cvičení se blíže podíváš na sloupec duration_min. Kola nesmí být půjčena déle než 24 hodin, tedy déle než 1440 minut, ale kvůli problémům s některými koly se čas vrácení zaznamenal nesprávně.

V tomto cvičení nahradíš chybné hodnoty horní hranicí rozsahu (1440 minut) — stejně dobře by ale bylo možné nahradit tyto hodnoty hodnotami NA.

dplyr, assertive a ggplot2 jsou načteny a datová sada bike_share_rides je k dispozici.

Pokyny 1/2

undefined XP
    1
    2
  • Vytvoř histogram se třemi koši pro sloupec duration_min z datové sady bike_share_rides pomocí ggplot2 a zjisti, jestli data obsahují hodnoty mimo povolený rozsah.