ComeçarComece gratuitamente

De volta para o futuro

Uma nova atualização do pipeline de dados que alimenta o DataFrame ride_sharing foi atualizada para registrar a data de cada viagem. Essas informações são armazenadas na coluna ride_date do tipo object, que representa strings no pandas.

Foi descoberto um bug que estava retransmitindo as viagens realizadas hoje como realizadas no próximo ano. Para corrigir isso, você encontrará todas as instâncias da coluna ride_date que ocorrem a qualquer momento no futuro e definirá o valor máximo possível dessa coluna como a data de hoje. Antes de fazer isso, você precisaria converter ride_date em um objeto datetime.

O pacote datetime foi importado como dt, juntamente com todos os pacotes que você tem usado até agora.

Este exercício faz parte do curso

Limpeza de dados em Python

Ver Curso

Instruções de exercício

  • Converta ride_date em um objeto datetime usando to_datetime() e, em seguida, converta o objeto datetime em um date e armazene-o na coluna ride_dt.
  • Crie a variável today, que armazena a data de hoje, usando a função dt.date.today().
  • Para todas as instâncias de ride_dt no futuro, defina-as para a data de hoje.
  • Imprima a data máxima na coluna ride_dt.

Exercício interativo prático

Experimente este exercício preenchendo este código de exemplo.

# Convert ride_date to date
ride_sharing['ride_dt'] = pd.____(____['____']).dt.date

# Save today's date
today = ____

# Set all in the future to today's date
ride_sharing.____[____['____'] > ____, '____'] = ____

# Print maximum of ride_dt column
print(ride_sharing['ride_dt'].____())
Editar e executar código