Sumar cadenas y concatenar números
En el ejercicio anterior, pudiste identificar que category es el tipo de dato correcto para user_type y convertirlo para extraer resúmenes estadísticos relevantes que arrojen luz sobre la distribución de user_type.
Otro problema común de los tipos de datos es importar como cadenas lo que deberían ser valores numéricos, ya que las operaciones matemáticas como la suma y la multiplicación conducen a la concatenación de cadenas, no a salidas numéricas.
En este ejercicio, convertirás la columna de cadena duration al tipo int. Antes, sin embargo, tendrás que asegurarte de eliminar "minutes" de la columna para que pandas la lea como numérica. El paquete pandas se ha importado como pd.
Este ejercicio forma parte del curso
Limpieza de datos en Python
Instrucciones del ejercicio
- Utiliza el método
.strip()para eliminardurationde"minutes"y almacenarlo en la columnaduration_trim. - Convierte
duration_trimeninty guárdalo en la columnaduration_time. - Escribe una instrucción
assertque compruebe siduration_timede tipo de datos es ahoraint. - Imprime la duración media del trayecto.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Strip duration of minutes
ride_sharing['duration_trim'] = ride_sharing['duration'].____.____()
# Convert duration to integer
ride_sharing['duration_time'] = ____
# Write an assert statement making sure of conversion
assert ride_sharing['____'].____ == '____'
# Print formed columns and calculate average ride duration
print(ride_sharing[['duration','duration_trim','duration_time']])
print(____)