1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Redukce dimenzionality v R

Connected

Cvičení

PCA v tidymodels

Z pohledu tvorby modelů ti PCA umožňuje stavět modely s menším počtem příznaků, přičemž stále zachytí většinu informací z původních dat. Jak jsi ale viděl/a, nevýhodou PCA je obtížná interpretace modelu. V tomto cvičení se zaměříš na sestavení modelu lineární regrese s využitím části dat o prodeji nemovitostí. Cílová proměnná je price.

Model postavený přímo na datech bez extrakce hlavních komponent dosahuje RMSE 236 461,4 $. Aplikuješ PCA pomocí tidymodels a porovnáš novou hodnotu RMSE. Pamatuj — čím nižší RMSE, tím lepší.

Balíčky tidyverse a tidymodels jsou již načteny.

Pokyny

100 XP
  • Sestav PCA recept s využitím train pro extrakci pěti hlavních komponent.
  • Natrénuj workflow s výchozí specifikací modelu linear_reg().
  • Vytvoř datový rámec s predikcemi na test, který obsahuje skutečné i předpovězené hodnoty.
  • Vypočítej RMSE pro model lineární regrese se snížením dimenzí pomocí PCA.