De volta para o futuro
Uma nova atualização do pipeline de dados que alimenta o DataFrame ride_sharing
foi atualizada para registrar a data de cada viagem. Essas informações são armazenadas na coluna ride_date
do tipo object
, que representa strings no pandas
.
Foi descoberto um bug que estava retransmitindo as viagens realizadas hoje como realizadas no próximo ano. Para corrigir isso, você encontrará todas as instâncias da coluna ride_date
que ocorrem a qualquer momento no futuro e definirá o valor máximo possível dessa coluna como a data de hoje. Antes de fazer isso, você precisaria converter ride_date
em um objeto datetime
.
O pacote datetime
foi importado como dt
, juntamente com todos os pacotes que você tem usado até agora.
Este exercício faz parte do curso
Limpeza de dados em Python
Instruções de exercício
- Converta
ride_date
em um objetodatetime
usandoto_datetime()
e, em seguida, converta o objetodatetime
em umdate
e armazene-o na colunaride_dt
. - Crie a variável
today
, que armazena a data de hoje, usando a funçãodt.date.today()
. - Para todas as instâncias de
ride_dt
no futuro, defina-as para a data de hoje. - Imprima a data máxima na coluna
ride_dt
.
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
# Convert ride_date to date
ride_sharing['ride_dt'] = pd.____(____['____']).dt.date
# Save today's date
today = ____
# Set all in the future to today's date
ride_sharing.____[____['____'] > ____, '____'] = ____
# Print maximum of ride_dt column
print(ride_sharing['ride_dt'].____())