1. Uczyć się
  2. /
  3. Courses
  4. /
  5. Modelowanie z tidymodels w R

Connected

Exercise

Usuwanie skorelowanych predyktorów za pomocą recipes

Usuwanie silnie skorelowanych zmiennych predykcyjnych ze zbiorów treningowego i testowego to ważny krok inżynierii cech, który pomaga zapewnić płynne dopasowanie modelu.

Skoro odkryłeś(-łaś), że monthly_charges i avg_data_gb są silnie skorelowane, musisz dodać filtr korelacji za pomocą step_corr() do swojego potoku inżynierii cech dla danych telekomunikacyjnych.

W tym ćwiczeniu utworzysz obiekt recipe, który usuwa skorelowane predyktory ze zbioru danych telekomunikacyjnych.

Zbiory danych telecom_training i telecom_test zostały wczytane do sesji.

Instrukcje 1/4

undefined XP
    1
    2
    3
    4
  • Utwórz obiekt recipe o nazwie telecom_cor_rec, który ustawia zmienną wynikową na canceled_service, a wszystkie pozostałe kolumny z telecom_training jako zmienne predykcyjne.
  • Dodaj krok przetwarzania wstępnego, który usuwa silnie skorelowane predyktory przy użyciu funkcji selektora all_numeric() i progu korelacji wynoszącego 0,8.