1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 데이터 정제하기

Connected

연습 문제

Back to the future

ride_sharing DataFrame으로 들어오는 데이터 파이프라인이 업데이트되어 각 승차의 날짜가 기록되기 시작했어요. 이 정보는 pandas에서 문자열을 나타내는 object 타입의 ride_date 열에 저장되어 있어요.

버그 때문에 오늘 탑승한 내역이 내년으로 기록되는 문제가 발견되었어요. 이를 고치려면, 앞으로의 날짜로 기록된 모든 ride_date 값을 찾아서, 이 열의 가능한 최댓값을 오늘 날짜로 설정해야 해요. 그 전에 ride_date를 datetime 객체로 변환해야 해요.

datetime 패키지는 지금까지 사용하던 패키지들과 함께 dt라는 이름으로 이미 임포트되어 있어요.

지침

100 XP
  • to_datetime()을 사용해 ride_date를 datetime 객체로 변환하고, 이를 다시 date로 변환해 ride_dt 열에 저장하세요.
  • dt.date.today() 함수를 사용해 오늘 날짜를 저장하는 변수 today를 만드세요.
  • 미래 시점의 모든 ride_dt 값을 오늘 날짜로 바꾸세요.
  • ride_dt 열의 최댓값을 출력하세요.