1. 学ぶ
  2. /
  3. コース
  4. /
  5. Rによる次元削減

Connected

演習

可能な組み合わせを計算する

healthcare_cat_df データフレームには、医療関連企業の従業員に関するカテゴリ変数と、退職したかどうかの情報が含まれています。このデータセットを使って、データ内に存在する特徴量の値の組み合わせ数を求めます。

Machine Learning モデルを学習する際は、各組み合わせについて十分な観測が含まれていることが望ましいです。したがって、組み合わせ数は、バイアスを避けるために必要となる最小観測数の目安を作るのに役立ちます。

tidyverse パッケージはすでに読み込まれています。

指示

100 XP
  • healthcare_cat_df に含まれる特徴量の値のすべての組み合わせを表現するために必要な最小の観測数を計算してください。