1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで学ぶデータクリーニング

Connected

演習

数値データ?それとも…?

この演習では、章を通してサンフランシスコの自転車ライドシェアデータ ride_sharing を扱います。開始駅と終了駅、移動時間、そしてバイクシェアサービスの一部ユーザー情報が含まれています。

user_type 列にはユーザーが無料乗車かどうかの情報があり、次の値を取ります。

  • 無料ライダーは 1
  • 都度払いは 2
  • 月額会員は 3

ここでは、.info() を使って ride_sharing の情報を表示し、データ型が誤っているとデータセットの分析にどのような不具合が起きるかを実際に確認します。pandas パッケージは pd としてインポート済みです。

指示1 / 3

undefined XP
    1
    2
    3
  • ride_sharing の情報を表示してください。
  • .describe() を使って、ride_sharing の user_type 列の要約統計量を表示してください。