Recorte de cuerdas
En el ejercicio anterior, pudo identificar el tipo de datos correcto y convertir user_birth_year
al tipo correcto, lo que le permitió extraer recuentos que le dieron un poco más de información sobre el conjunto de datos.
Otro problema común de los datos sucios es tener bits extra como signos de porcentaje o puntos en los números, haciendo que se lean como character
s. Para poder procesar estos números, hay que eliminar los bits adicionales y convertirlos de character
a numeric
. En este ejercicio, tendrá que convertir la columna duration
de character
a numeric
, pero antes de que esto pueda suceder, es necesario eliminar la palabra "minutes"
de cada valor.
dplyr
, assertive
, y stringr
están cargados y bike_share_rides
está disponible.
Este ejercicio forma parte del curso
Limpieza de datos en R
Instrucciones de ejercicio
- Utilice
str_remove()
para eliminar"minutes"
de la columnaduration
debike_share_rides
. Añádalo como una nueva columna llamadaduration_trimmed
. - Convierta la columna
duration_trimmed
a un tipo numérico y añádala como una nueva columna llamadaduration_mins
. - Eche un vistazo a
bike_share_rides
y afirme que la columnaduration_mins
esnumeric
. - Calcula la media de
duration_mins
.
Ejercicio interactivo práctico
Pruebe este ejercicio completando este código de muestra.
bike_share_rides <- bike_share_rides %>%
# Remove 'minutes' from duration: duration_trimmed
mutate(duration_trimmed = ___,
# Convert duration_trimmed to numeric: duration_mins
duration_mins = ___)
# Glimpse at bike_share_rides
___
# Assert duration_mins is numeric
___
# Calculate mean duration
___