1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで学ぶデータクリーニング

Connected

演習

カテゴリの再マッピング

airlines のアンケート回答をよりよく理解するために、特定の回答と曜日・ゲートでの待ち時間との関係を調べたいとします。

airlines DataFrame には、カテゴリ変数の day と数値変数の wait_min 列があります。day にはフライトが行われた正確な曜日、wait_min には搭乗口での待ち時間(分)が入っています。分析をしやすくするため、次の2つの新しいカテゴリ変数を作成します。

  • wait_type: 0〜60 分なら 'short'、60〜180 分なら 'medium'、180 分以上は long
  • day_week: 平日なら 'weekday'、週末なら 'weekend'

pandas と numpy パッケージはそれぞれ pd と np としてインポート済みです。さっそく新しいカテゴリデータを作っていきましょう!

指示

100 XP
  • 説明で示した wait_type 列用の範囲とラベルを作成します。
  • pd.cut() を使って wait_min から wait_type 列を作成し、label_ranges と label_names を正しい引数に渡します。
  • 平日を 'weekday'、週末を 'weekend' に対応づける mapping 辞書を作成します。
  • .replace() を用いて day_week 列を作成します。