1. Learn
  2. /
  3. Cursuri
  4. /
  5. Curățarea datelor în R

Connected

exercițiu

Constrângeri privind durata curselor

Valorile în afara intervalului admis pot denatura o analiză, așa că este important să le identifici din timp. În acest exercițiu, vei examina mai îndeaproape coloana duration_min. Bicicletele nu au voie să fie ținute mai mult de 24 de ore, adică 1440 de minute la o singură cursă, însă unele defecțiuni au dus la înregistrarea incorectă a momentului returnării.

În acest exercițiu, vei înlocui datele eronate cu limita intervalului (1440 de minute); la fel de bine ai putea înlocui aceste valori cu NA.

dplyr, assertive și ggplot2 sunt încărcate, iar bike_share_rides este disponibil.

Instrucțiuni 1/2

undefined XP
    1
    2
  • Creează o histogramă cu trei intervale pentru coloana duration_min din bike_share_rides folosind ggplot2, pentru a identifica dacă există date în afara intervalului admis.