De volta para o futuro
Uma nova atualização do pipeline de dados que alimenta o DataFrame ride_sharing foi atualizada para registrar a data de cada viagem. Essas informações são armazenadas na coluna ride_date do tipo object, que representa strings no pandas.
Foi descoberto um bug que estava retransmitindo as viagens realizadas hoje como realizadas no próximo ano. Para corrigir isso, você encontrará todas as instâncias da coluna ride_date que ocorrem a qualquer momento no futuro e definirá o valor máximo possível dessa coluna como a data de hoje. Antes de fazer isso, você precisaria converter ride_date em um objeto datetime.
O pacote datetime foi importado como dt, juntamente com todos os pacotes que você tem usado até agora.
Este exercício faz parte do curso
Limpeza de dados em Python
Instruções do exercício
- Converta
ride_dateem um objetodatetimeusandoto_datetime()e, em seguida, converta o objetodatetimeem umdatee armazene-o na colunaride_dt. - Crie a variável
today, que armazena a data de hoje, usando a funçãodt.date.today(). - Para todas as instâncias de
ride_dtno futuro, defina-as para a data de hoje. - Imprima a data máxima na coluna
ride_dt.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Convert ride_date to date
ride_sharing['ride_dt'] = pd.____(____['____']).dt.date
# Save today's date
today = ____
# Set all in the future to today's date
ride_sharing.____[____['____'] > ____, '____'] = ____
# Print maximum of ride_dt column
print(ride_sharing['ride_dt'].____())