1. Learn
  2. /
  3. Courses
  4. /
  5. Reducerea dimensionalității în R

Connected

Exercise

PCA în tidymodels

Din perspectiva construirii modelelor, PCA îți permite să creezi modele cu mai puține caracteristici, păstrând totuși cea mai mare parte a informațiilor din datele originale. Cu toate acestea, după cum ai văzut, un dezavantaj al PCA este dificultatea de a interpreta modelul. În acest exercițiu, vei construi un model de regresie liniară folosind un subset al datelor despre vânzările de locuințe. Variabila țintă este price.

Un model construit direct din date, fără extragerea componentelor principale, are un RMSE de 236.461,4 USD. Vei aplica PCA cu tidymodels și vei compara noul RMSE. Ține minte: cu cât RMSE-ul este mai mic, cu atât mai bine.

Pachetele tidyverse și tidymodels au fost deja încărcate pentru tine.

Instructions

100 XP
  • Construiește o rețetă PCA folosind train pentru a extrage cinci componente principale.
  • Antrenează un workflow cu o specificație implicită de model linear_reg().
  • Creează un cadru de date cu predicțiile pentru setul test, care să conțină valorile reale și cele prezise.
  • Calculează RMSE-ul pentru modelul de regresie liniară redus prin PCA.