1. 学ぶ
  2. /
  3. コース
  4. /
  5. tidyrでデータを整形する

Connected

演習

そして監督賞は…… <NA> に?

director_df として事前に読み込まれている Netflix データセットのサンプルを扱います。今回は、データフレームには監督名と映画タイトルのみが入っています。目標は、最も多くの映画を手がけた監督を特定することです。director 列には複数の名前が入っているので、まずは値を複数行に分割し、その後で監督ごとに数えます。

監督が不明の映画で集計が汚れないように、drop_na() 関数を使います。

dplyr パッケージはすでに読み込まれています。

指示1 / 3

undefined XP
    1
    2
    3
  • コンソールで director_df を確認し、director 列で監督名を区切っている文字列が何かを調べます。
  • director 列の値を行方向に展開し、監督名ごとに別々の行に分けます。