1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Supervised Learning in R: Regression

Connected

Cvičení

Transformace vstupů: „hokejová hůl"

V tomto cvičení sestavíš model pro predikci ceny na základě velikosti domu (plochy). Dataset houseprice, který máš k dispozici, obsahuje tyto sloupce:

  • price: cena domu v jednotkách 1 000 $
  • size: plocha domu

Rozptylový graf dat ukazuje výrazně nelineární vztah – takzvaný tvar „hokejové hole", kdy cena u menších domů téměř neroste, ale s větší plochou strmě stoupá. Kvadratické a kubické funkce jsou pro vyjádření takovýchto vztahů často vhodnou volbou. Nemusí přitom existovat žádný „fyzikální" důvod, proč by price mělo záviset na druhé mocnině size – kvadratická funkce je prostě uzavřenou aproximací pozorovaného vztahu.

scatterplot

Sestavíš model, který predikuje cenu jako funkci druhé mocniny plochy, a podíváš se, jak dobře odpovídá trénovacím datům.

Protože ^ se používá také k vyjádření interakcí, použij funkci I() (docs), která zajistí, že výraz x^2 bude zpracován „tak, jak je" – tedy jako druhá mocnina x, nikoli jako interakce x se sebou samým.

exampleFormula = y ~ I(x^2)

Pokyny

100 XP
  • Zapiš vzorec fmla_sqr vyjadřující cenu jako funkci druhé mocniny plochy. Vypiš ho.
  • Na základě fmla_sqr natrénuj model model_sqr.
  • Pro srovnání natrénuj lineární model model_lin s vzorcem price ~ size.
  • Doplň chybějící části kódu tak, aby:
    • oba modely vytvořily predikce na trénovacích datech,
    • predikce byly sloučeny do jednoho sloupce pred pomocí pivot_longer(),
    • bylo možné graficky porovnat predikce obou modelů s reálnými daty. Který model sedí lépe?