1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Machine Learning for Marketing Analytics in R

Connected

cvičení

Lineární regrese s hlavními komponentami

Objekt newsData nyní obsahuje dodatečnou proměnnou: logShares. Počet sdílení říká, jak často byly zpravodajské články sdíleny. Toto rozdělení by však bylo silně zešikmené, takže budeš pracovat s logaritmem počtu sdílení. Využij to, co ses právě naučil/a, a proveď predikci logaritmu sdílení!

Pokyny

100 XP
  • Sestav model pro predikci logaritmu sdílení pomocí všech ostatních proměnných. Ulož ho jako mod1.
  • Vytvoř nový dataframe dataNewsComponents s logaritmem sdílení a hodnotami na prvních 6 komponentách. Objekt pcaNews opět obsahuje výsledky PCA.
  • Sestav druhý model (mod2), který predikuje logaritmus sdílení pomocí pouze 6 komponent.
  • Porovnej upravené R² obou modelů. Jak se hodnota změnila při použití pouze hlavních komponent? Jak dobrý je tvůj model?