ComeçarComece gratuitamente

Soma de strings e concatenação de números

No exercício anterior, você conseguiu identificar que category é o tipo de dados correto para user_type e converteu-o para extrair resumos estatísticos relevantes que esclarecem a distribuição de user_type.

Outro problema comum de tipo de dados é a importação do que deveria ser valores numéricos como strings, pois operações matemáticas como soma e multiplicação levam à concatenação de strings, e não a saídas numéricas.

Neste exercício, você converterá a coluna de strings duration para o tipo int. Antes disso, porém, você precisará retirar "minutes" da coluna para garantir que o pandas a leia como numérica. O pacote pandas foi importado como pd.

Este exercício faz parte do curso

Limpeza de dados em Python

Ver Curso

Instruções de exercício

  • Use o método .strip() para remover duration de "minutes" e armazená-lo na coluna duration_trim.
  • Converta duration_trim em int e armazene-o na coluna duration_time.
  • Escreva uma instrução assert que verifique se o tipo de dadosde duration_time é agora um int.
  • Imprima a duração média da viagem.

Exercício interativo prático

Experimente este exercício preenchendo este código de exemplo.

# Strip duration of minutes
ride_sharing['duration_trim'] = ride_sharing['duration'].____.____()

# Convert duration to integer
ride_sharing['duration_time'] = ____

# Write an assert statement making sure of conversion
assert ride_sharing['____'].____ == '____'

# Print formed columns and calculate average ride duration 
print(ride_sharing[['duration','duration_trim','duration_time']])
print(____)
Editar e executar código