1. Nauka
  2. /
  3. Kursy
  4. /
  5. Czyszczenie danych w R

Connected

ćwiczenie

Ograniczenia czasu trwania przejazdu

Wartości spoza dozwolonego zakresu mogą zaburzać wyniki analizy, dlatego warto je wychwycić jak najwcześniej. W tym ćwiczeniu dokładniej przyjrzysz się kolumnie duration_min. Rowery nie mogą być wypożyczone na dłużej niż 24 godziny, czyli 1440 minut jednorazowo, jednak awarie niektórych rowerów spowodowały nieprawidłowy zapis czasu ich zwrotu.

W tym ćwiczeniu zastąpisz błędne dane wartością graniczną zakresu (1440 minut) – równie dobrze możesz jednak zastąpić te wartości NA.

Biblioteki dplyr, assertive i ggplot2 są już wczytane, a zbiór danych bike_share_rides jest dostępny.

Instrukcje 1/2

undefined XP
    1
    2
  • Stwórz histogram z trzema przedziałami dla kolumny duration_min ze zbioru danych bike_share_rides, używając ggplot2, aby sprawdzić, czy w danych występują wartości spoza dozwolonego zakresu.