1. 学ぶ
  2. /
  3. コース
  4. /
  5. R での tidymodels によるモデリング

Connected

演習

特徴量エンジニアリングのプロセス

特徴量エンジニアリングをモデリングプロセスに組み込むには、モデルの学習段階に入る前に、学習用データとテストデータを前処理する必要があります。この章で学んだ新しいスキルを使えば、通信データにあるすべての利用可能な説明変数を活用して、ロジスティック回帰モデルを学習できるようになります。

この演習では、通信データに対して特徴量エンジニアリングのパイプラインを作成し、それを使って学習用データとテストデータを変換します。

telecom_training と telecom_test の各データセット、およびロジスティック回帰のモデル仕様 logistic_model は、すでにセッションに読み込まれています。

指示1 / 3

undefined XP
    1
    2
    3
  • 目的変数を canceled_service、telecom_training の残りのすべての列を説明変数として設定する recipe オブジェクト telecom_recipe を作成します。
  • セレクタ関数を使って、相関の高い説明変数をしきい値 0.8 で除去し、数値の説明変数をすべて対数変換し、数値の説明変数を正規化し、名義の説明変数すべてにダミー変数を作成します。