1. เรียนรู้
  2. /
  3. Courses
  4. /
  5. Pythonで学ぶデータクリーニング

Connected

Exercises

バック・トゥ・ザ・フューチャー

ride_sharing DataFrame に取り込まれるデータパイプラインが更新され、各乗車の日付が登録されるようになりました。この情報は pandas で文字列を表す型 object の ride_date 列に保存されています。

本日分の乗車が翌年として記録されてしまう不具合が見つかりました。これを修正するために、将来の日付になっている ride_date のすべての値を見つけ、この列の取りうる最大値を本日の日付に設定します。その前に、ride_date を datetime オブジェクトに変換する必要があります。

datetime パッケージは dt としてインポート済みで、これまで使用してきたすべてのパッケージも利用できます。

คำแนะนำ

100 XP
  • to_datetime() を使って ride_date を datetime オブジェクトに変換し、その datetime を date に変換して ride_dt 列に保存します。
  • dt.date.today() 関数を使って、今日の日付を保持する変数 today を作成します。
  • 未来日になっているすべての ride_dt を今日の日付に置き換えます。
  • ride_dt 列の最大日付を出力します。