Kendala durasi perjalanan
Nilai di luar rentang dapat mengacaukan analisis, sehingga penting untuk mendeteksinya sejak awal. Dalam latihan ini, Anda akan menelaah kolom duration_min lebih saksama. Sepeda tidak diizinkan dipakai lebih dari 24 jam, atau 1440 menit sekali pakai, tetapi masalah pada beberapa sepeda menyebabkan pencatatan waktu pengembalian yang tidak akurat.
Dalam latihan ini, Anda akan mengganti data yang keliru dengan batas rentang (1440 menit). Namun, Anda juga bisa mengganti nilai-nilai ini dengan NA.
dplyr, assertive, dan ggplot2 sudah dimuat dan bike_share_rides tersedia.
Latihan ini adalah bagian dari kursus
Membersihkan Data di R
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Create breaks
breaks <- c(___, 0, 1440, ___)
# Create a histogram of duration_min
ggplot(___, aes(___)) +
___(breaks = ___)