1. 学ぶ
  2. /
  3. コース
  4. /
  5. Rによる次元削減

Connected

演習

欠損値率フィルターを適用する

欠損値率を計算できたので、欠損値のしきい値を使ってフィルターを作成できます。この演習では、任意ではありますが妥当な欠損値率のしきい値を設定し、すべての列に適用します。実務では、各特徴量に合わせてしきい値を吟味し、調整します。

前の演習で計算した比率を含む missing_vals_df と、house_sales_df データフレームが利用可能です。tidyverse パッケージも読み込まれています。

指示

100 XP
  • missing_vals_df としきい値 0.5 を使って欠損値率フィルターを作成し、missing_vals_filter に保存します。
  • missing_vals_df を用いて house_sales_df の次元を削減し、新しいデータフレームを filtered_house_sales_df に保存します。