1. 学ぶ
  2. /
  3. コース
  4. /
  5. tidyverse で学ぶカテゴリ型データ

Connected

演習

水準数を調べる

データセットを探索するときに役立つ dplyr の関数がほかにも2つあります。1つ目は slice_max(var, n = x) で、var の値に基づいて先頭から x 行を取得します。もう1つは pull() で、列を取り出して列名を外し、列の値だけをベクトルとして取得できます。

たとえば、クラシックな mtcars データセットから mpg の上位2つの値をセットとして取得したい場合は、次のように書きます。

mtcars %>%
  slice_max(mpg, n = 2) %>%
  pull(mpg)

これにより、次の結果が得られます。

[1] 32.4 33.9

指示

100 XP
  • slice_max() を使って、ファクターの水準数が最も多い上位3行を表示します。
  • 変数 CurrentJobTitleSelect をフィルタリングし、その水準数を pull で取り出してください。