Memangkas string
Pada latihan sebelumnya, Anda dapat mengidentifikasi tipe data yang benar dan mengonversi user_birth_year ke tipe yang tepat, sehingga memungkinkan Anda mengekstrak jumlah yang memberi sedikit lebih banyak wawasan tentang himpunan data.
Masalah data kotor lain yang umum adalah adanya tambahan seperti tanda persen atau titik pada angka, sehingga angka tersebut dibaca sebagai character. Agar dapat mengolah angka-angka ini, bagian tambahan perlu dihapus dan angkanya perlu dikonversi dari character menjadi numeric. Pada latihan ini, Anda perlu mengonversi kolom duration dari character menjadi numeric, tetapi sebelum itu terjadi, kata "minutes" perlu dihapus dari setiap nilai.
dplyr, assertive, dan stringr telah dimuat dan bike_share_rides tersedia.
Latihan ini adalah bagian dari kursus
Membersihkan Data di R
Petunjuk latihan
- Gunakan
str_remove()untuk menghapus"minutes"dari kolomdurationpadabike_share_rides. Tambahkan hasilnya sebagai kolom baru bernamaduration_trimmed. - Konversikan kolom
duration_trimmedke tipe numerik dan tambahkan sebagai kolom baru bernamaduration_mins. - Lihat sekilas
bike_share_ridesdan pastikan bahwa kolomduration_minsbertipenumeric. - Hitung mean dari
duration_mins.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
bike_share_rides <- bike_share_rides %>%
# Remove 'minutes' from duration: duration_trimmed
mutate(duration_trimmed = ___,
# Convert duration_trimmed to numeric: duration_mins
duration_mins = ___)
# Glimpse at bike_share_rides
___
# Assert duration_mins is numeric
___
# Calculate mean duration
___