ComenzarEmpieza gratis

Regreso al futuro

Se ha actualizado la canalización de datos que alimenta el DataFrame ride_sharing para registrar la fecha de cada viaje. Esta información se almacena en la columna ride_date del tipo object, que representa cadenas en pandas.

Se ha descubierto un error que considera los viajes realizados hoy como realizados el año que viene. Para solucionarlo, buscarás todas las instancias de la columna ride_date que ocurran en cualquier momento del futuro, y establecerás el valor máximo posible de esta columna en la fecha de hoy. Antes de hacerlo, tendrías que convertir ride_date en un objeto datetime.

El paquete datetime se ha importado como dt, junto con todos los paquetes que has estado utilizando hasta ahora.

Este ejercicio forma parte del curso

Limpieza de datos en Python

Ver curso

Instrucciones del ejercicio

  • Convierte ride_date en un objeto datetime utilizando to_datetime(), luego convierte el objeto datetime en un date y almacénalo en la columna ride_dt.
  • Crea la variable today, que almacena la fecha de hoy utilizando la función dt.date.today().
  • Para todas las instancias de ride_dt en el futuro, ajústalas a la fecha de hoy.
  • Imprime la fecha máxima en la columna ride_dt.

Ejercicio interactivo práctico

Prueba este ejercicio completando el código de muestra.

# Convert ride_date to date
ride_sharing['ride_dt'] = pd.____(____['____']).dt.date

# Save today's date
today = ____

# Set all in the future to today's date
ride_sharing.____[____['____'] > ____, '____'] = ____

# Print maximum of ride_dt column
print(ride_sharing['ride_dt'].____())
Editar y ejecutar código