1. 学ぶ
  2. /
  3. コース
  4. /
  5. R での tidymodels によるモデリング

Connected

演習

特徴量エンジニアリングのパイプラインを完成させる

recipes パッケージは、複数の特徴量エンジニアリング手順を1つのオブジェクトにまとめ、Machine Learning のワークフローでデータ変換を管理しやすくするためのものです。

この演習では、モデリングに向けて通信業データを前処理する特徴量エンジニアリングのパイプラインを学習します。

telecom_df の tibble と、前の演習で作成した telecom_training および telecom_test データセットは、すでにワークスペースに読み込まれています。

指示

100 XP
  • 訓練データのすべての説明変数を使って canceled_service を予測するレシピを作成します。
  • しきい値 0.8 を用いて、相関の高い説明変数を削除します。
  • すべての数値の説明変数を正規化します。
  • すべてのカテゴリ型(名義尺度)の説明変数についてダミー変数を作成します。
  • レシピを訓練データで学習し、テストデータに適用します。