Regreso al futuro
Se ha actualizado la canalización de datos que alimenta el DataFrame ride_sharing para registrar la fecha de cada viaje. Esta información se almacena en la columna ride_date del tipo object, que representa cadenas en pandas.
Se ha descubierto un error que considera los viajes realizados hoy como realizados el año que viene. Para solucionarlo, buscarás todas las instancias de la columna ride_date que ocurran en cualquier momento del futuro, y establecerás el valor máximo posible de esta columna en la fecha de hoy. Antes de hacerlo, tendrías que convertir ride_date en un objeto datetime.
El paquete datetime se ha importado como dt, junto con todos los paquetes que has estado utilizando hasta ahora.
Este ejercicio forma parte del curso
Limpieza de datos en Python
Instrucciones del ejercicio
- Convierte
ride_dateen un objetodatetimeutilizandoto_datetime(), luego convierte el objetodatetimeen undatey almacénalo en la columnaride_dt. - Crea la variable
today, que almacena la fecha de hoy utilizando la funcióndt.date.today(). - Para todas las instancias de
ride_dten el futuro, ajústalas a la fecha de hoy. - Imprime la fecha máxima en la columna
ride_dt.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Convert ride_date to date
ride_sharing['ride_dt'] = pd.____(____['____']).dt.date
# Save today's date
today = ____
# Set all in the future to today's date
ride_sharing.____[____['____'] > ____, '____'] = ____
# Print maximum of ride_dt column
print(ride_sharing['ride_dt'].____())