1. Learn
  2. /
  3. Courses
  4. /
  5. Modelowanie z tidymodels w R

Connected

Exercise

Odkrywanie skorelowanych predyktorów

Skorelowane zmienne predykcyjne dostarczają redundantnych informacji i mogą negatywnie wpływać na proces dopasowywania modelu. Gdy dwie zmienne są silnie skorelowane, ich wartości zmieniają się liniowo względem siebie – co oznacza, że przekazują algorytmom uczenia maszynowego te same informacje. Zjawisko to nosi nazwę wielokoliniowości.

Zanim rozpoczniesz dopasowywanie modelu, warto dokładnie przeanalizować zbiór danych, aby wykryć takie zależności i wyeliminować je na etapie inżynierii cech.

W tym ćwiczeniu zbadasz zbiór danych telecom_training, tworząc macierz korelacji dla wszystkich numerycznych zmiennych predykcyjnych.

Dane telecom_training zostały już wczytane do twojej sesji.

Instructions 1/3

undefined XP
    1
    2
    3
  • Wybierz wszystkie kolumny numeryczne ze zbioru danych telecom_training.
  • Utwórz macierz korelacji dla kolumn numerycznych zbioru telecom_training.