Soma de strings e concatenação de números
No exercício anterior, você conseguiu identificar que category
é o tipo de dados correto para user_type
e converteu-o para extrair resumos estatísticos relevantes que esclarecem a distribuição de user_type
.
Outro problema comum de tipo de dados é a importação do que deveria ser valores numéricos como strings, pois operações matemáticas como soma e multiplicação levam à concatenação de strings, e não a saídas numéricas.
Neste exercício, você converterá a coluna de strings duration
para o tipo int
. Antes disso, porém, você precisará retirar "minutes"
da coluna para garantir que o pandas
a leia como numérica. O pacote pandas
foi importado como pd
.
Este exercício faz parte do curso
Limpeza de dados em Python
Instruções de exercício
- Use o método
.strip()
para removerduration
de"minutes"
e armazená-lo na colunaduration_trim
. - Converta
duration_trim
emint
e armazene-o na colunaduration_time
. - Escreva uma instrução
assert
que verifique se o tipo de dadosdeduration_time
é agora umint
. - Imprima a duração média da viagem.
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
# Strip duration of minutes
ride_sharing['duration_trim'] = ride_sharing['duration'].____.____()
# Convert duration to integer
ride_sharing['duration_time'] = ____
# Write an assert statement making sure of conversion
assert ride_sharing['____'].____ == '____'
# Print formed columns and calculate average ride duration
print(ride_sharing[['duration','duration_trim','duration_time']])
print(____)