1. 학습
  2. /
  3. 강의
  4. /
  5. R での tidymodels によるモデリング

Connected

연습 문제

目的変数の値の分布

学習用データとテストデータを作成するときに目的変数で層化すると、両方のデータセットで目的変数の値の範囲が近くなるようにできます。

元のデータはランダムに分割されるため、たとえば home_sales の高額物件ばかりがテストデータに入ってしまう、といった事態を層化によって防げます。このような場合、学習には安価な物件しか含まれないため、モデルの性能は低下しやすくなります。

この演習では、学習用データとテストデータにおける selling_price 変数の要約統計量を計算します。home_training と home_test の tibble は前の演習から読み込まれています。

지침 1/2

undefined XP
  • 1
    • home_training の selling_price 変数について、最小値、最大値、平均、標準偏差を計算してください。
  • 2
    • home_test の selling_price 変数について、最小値、最大値、平均、標準偏差を計算してください。