Vanuit modelbouwperspectief kun je met PCA modellen maken met minder features, terwijl je toch het grootste deel van de informatie uit de oorspronkelijke data behoudt. Zoals je hebt gezien, is een nadeel van PCA dat het model lastiger te interpreteren is. In deze oefening bouw je een lineair regressiemodel met een subset van de gegevens over woningverkopen. De doelvariabele is price.

Een model dat direct is gebouwd op de data zonder hoofdcomponenten te extraheren heeft een RMSE van $236,461.4. Je past PCA toe met tidymodels en vergelijkt de nieuwe RMSE. Onthoud: een lagere RMSE is beter.

De pakketten tidyverse en tidymodels zijn al voor je geladen.

Afronding

Create Your Free Account