1. 学ぶ
  2. /
  3. コース
  4. /
  5. Rで学ぶ探索的データ分析

Connected

演習

水準の削除

前の演習の分割表から、件数が非常に少ない水準があることがわかりました。分析をシンプルにするために、そのような水準を落とすのが有効な場合があります。

R では、まず件数が非常に少ない水準をもつ行をフィルタで取り除き、その後に droplevels() で因子変数からその水準を削除する、という2段階が必要です。これは、droplevels() は 1 件や 2 件だけある水準は保持し、データセット内にまったく存在しない水準だけを落とすためです。

指示

100 XP

前の演習で作成した分割表は tab としてワークスペースに用意されています。

  • dplyr パッケージを読み込みます。
  • tab を表示して、align のどの水準が合計件数で最も少ないかを確認します。
  • その水準の行をすべて除外するように filter() で comics をフィルタし、続けて droplevels() で未使用の水準を落とします。簡略化したデータセットを comics_filtered として保存します。