ComenzarEmpieza gratis

Sumar cadenas y concatenar números

En el ejercicio anterior, pudiste identificar que category es el tipo de dato correcto para user_type y convertirlo para extraer resúmenes estadísticos relevantes que arrojen luz sobre la distribución de user_type.

Otro problema común de los tipos de datos es importar como cadenas lo que deberían ser valores numéricos, ya que las operaciones matemáticas como la suma y la multiplicación conducen a la concatenación de cadenas, no a salidas numéricas.

En este ejercicio, convertirás la columna de cadena duration al tipo int. Antes, sin embargo, tendrás que asegurarte de eliminar "minutes" de la columna para que pandas la lea como numérica. El paquete pandas se ha importado como pd.

Este ejercicio forma parte del curso

Limpieza de datos en Python

Ver curso

Instrucciones de ejercicio

  • Utiliza el método .strip() para eliminar duration de "minutes" y almacenarlo en la columna duration_trim.
  • Convierte duration_trim en int y guárdalo en la columna duration_time.
  • Escribe una instrucción assert que compruebe si duration_time de tipo de datos es ahora int.
  • Imprime la duración media del trayecto.

Ejercicio interactivo práctico

Pruebe este ejercicio completando este código de muestra.

# Strip duration of minutes
ride_sharing['duration_trim'] = ride_sharing['duration'].____.____()

# Convert duration to integer
ride_sharing['duration_time'] = ____

# Write an assert statement making sure of conversion
assert ride_sharing['____'].____ == '____'

# Print formed columns and calculate average ride duration 
print(ride_sharing[['duration','duration_trim','duration_time']])
print(____)
Editar y ejecutar código