ComenzarEmpieza gratis

Recorte de cuerdas

En el ejercicio anterior, pudo identificar el tipo de datos correcto y convertir user_birth_year al tipo correcto, lo que le permitió extraer recuentos que le dieron un poco más de información sobre el conjunto de datos.

Otro problema común de los datos sucios es tener bits extra como signos de porcentaje o puntos en los números, haciendo que se lean como characters. Para poder procesar estos números, hay que eliminar los bits adicionales y convertirlos de character a numeric. En este ejercicio, tendrá que convertir la columna duration de character a numeric, pero antes de que esto pueda suceder, es necesario eliminar la palabra "minutes" de cada valor.

dplyr, assertive, y stringr están cargados y bike_share_rides está disponible.

Este ejercicio forma parte del curso

Limpieza de datos en R

Ver curso

Instrucciones de ejercicio

  • Utilice str_remove() para eliminar "minutes" de la columna duration de bike_share_rides. Añádalo como una nueva columna llamada duration_trimmed.
  • Convierta la columna duration_trimmed a un tipo numérico y añádala como una nueva columna llamada duration_mins.
  • Eche un vistazo a bike_share_rides y afirme que la columna duration_mins es numeric.
  • Calcula la media de duration_mins.

Ejercicio interactivo práctico

Pruebe este ejercicio completando este código de muestra.

bike_share_rides <- bike_share_rides %>%
  # Remove 'minutes' from duration: duration_trimmed
  mutate(duration_trimmed = ___,
         # Convert duration_trimmed to numeric: duration_mins
         duration_mins = ___)

# Glimpse at bike_share_rides
___

# Assert duration_mins is numeric
___

# Calculate mean duration
___
Editar y ejecutar código