Regreso al futuro
Se ha actualizado la canalización de datos que alimenta el DataFrame ride_sharing
para registrar la fecha de cada viaje. Esta información se almacena en la columna ride_date
del tipo object
, que representa cadenas en pandas
.
Se ha descubierto un error que considera los viajes realizados hoy como realizados el año que viene. Para solucionarlo, buscarás todas las instancias de la columna ride_date
que ocurran en cualquier momento del futuro, y establecerás el valor máximo posible de esta columna en la fecha de hoy. Antes de hacerlo, tendrías que convertir ride_date
en un objeto datetime
.
El paquete datetime
se ha importado como dt
, junto con todos los paquetes que has estado utilizando hasta ahora.
Este ejercicio forma parte del curso
Limpieza de datos en Python
Instrucciones del ejercicio
- Convierte
ride_date
en un objetodatetime
utilizandoto_datetime()
, luego convierte el objetodatetime
en undate
y almacénalo en la columnaride_dt
. - Crea la variable
today
, que almacena la fecha de hoy utilizando la funcióndt.date.today()
. - Para todas las instancias de
ride_dt
en el futuro, ajústalas a la fecha de hoy. - Imprime la fecha máxima en la columna
ride_dt
.
Ejercicio interactivo práctico
Prueba este ejercicio completando el código de muestra.
# Convert ride_date to date
ride_sharing['ride_dt'] = pd.____(____['____']).dt.date
# Save today's date
today = ____
# Set all in the future to today's date
ride_sharing.____[____['____'] > ____, '____'] = ____
# Print maximum of ride_dt column
print(ride_sharing['ride_dt'].____())