Sumar cadenas y concatenar números
En el ejercicio anterior, pudiste identificar que category
es el tipo de dato correcto para user_type
y convertirlo para extraer resúmenes estadísticos relevantes que arrojen luz sobre la distribución de user_type
.
Otro problema común de los tipos de datos es importar como cadenas lo que deberían ser valores numéricos, ya que las operaciones matemáticas como la suma y la multiplicación conducen a la concatenación de cadenas, no a salidas numéricas.
En este ejercicio, convertirás la columna de cadena duration
al tipo int
. Antes, sin embargo, tendrás que asegurarte de eliminar "minutes"
de la columna para que pandas
la lea como numérica. El paquete pandas
se ha importado como pd
.
Este ejercicio forma parte del curso
Limpieza de datos en Python
Instrucciones de ejercicio
- Utiliza el método
.strip()
para eliminarduration
de"minutes"
y almacenarlo en la columnaduration_trim
. - Convierte
duration_trim
enint
y guárdalo en la columnaduration_time
. - Escribe una instrucción
assert
que compruebe siduration_time
de tipo de datos es ahoraint
. - Imprime la duración media del trayecto.
Ejercicio interactivo práctico
Pruebe este ejercicio completando este código de muestra.
# Strip duration of minutes
ride_sharing['duration_trim'] = ride_sharing['duration'].____.____()
# Convert duration to integer
ride_sharing['duration_time'] = ____
# Write an assert statement making sure of conversion
assert ride_sharing['____'].____ == '____'
# Print formed columns and calculate average ride duration
print(ride_sharing[['duration','duration_trim','duration_time']])
print(____)