1. 学ぶ
  2. /
  3. コース
  4. /
  5. Rでのデータクリーニング

Connected

演習

メンバーではない

メンバーシップ制約の問題を見つける練習ができたので、新しいデータセットで実際に修正していきます。この章では、San Francisco International Airport (SFO) からのフライトに搭乗した乗客へのアンケート回答をまとめた sfo_survey データセットを使います。空港の清潔さ、待ち時間、安全性、そして総合満足度について質問しています。

データ収集の過程でいくつか不備があり、データセットに不整合が生じています。この演習では、乗客が向かった到着空港の規模をカテゴリ化した dest_size 列を扱います。到着空港の規模の全候補を含む dest_sizes というデータフレームが用意されています。あなたのミッションは、無効な dest_size を含む行を見つけて、データフレームから取り除くことです。

dplyr は読み込まれており、sfo_survey と dest_sizes が利用可能です。

指示1 / 4

undefined XP
    1
    2
    3
    4
  • sfo_survey の各 dest_size の出現回数を数えます。