1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Supervised Learning in R: Regression

Connected

Cvičení

Modelování interakce

V tomto cvičení použiješ interakce k modelování vlivu pohlaví a žaludeční aktivity na metabolismus alkoholu.

Dataový rámec alcohol je předem načtený a obsahuje tyto sloupce:

  • Metabol: rychlost metabolismu alkoholu
  • Gastric: rychlost aktivity žaludeční alkoholdehydrogenázy
  • Sex: pohlaví konzumenta (Male nebo Female)

Ve videu jsme na data alcohol natrénovali tři modely:

  • jeden pouze s aditivními členy (hlavní efekty): Metabol ~ Gastric + Sex
  • dva modely, každý s interakcemi mezi žaludeční aktivitou a pohlavím

Vidíš, že jeden z modelů s interakčními členy dosáhl lepšího R-squared než aditivní model – to naznačuje, že použití interakcí vede k lepšímu přizpůsobení dat. V tomto cvičení porovnáš R-squared jednoho z interakčních modelů s modelem obsahujícím pouze hlavní efekty.

Připomeň si, že operátor : označuje interakci dvou proměnných. Operátor * označuje interakci dvou proměnných včetně jejich hlavních efektů.

x*y = x + y + x:y

Pokyny

100 XP
  • Napiš vzorec, který vyjadřuje Metabol jako funkci Gastric a Sex bez interakcí.
    • Přiřaď vzorec do proměnné fmla_add a vypiš ho.
  • Napiš vzorec, který vyjadřuje Metabol jako funkci interakce mezi Gastric a Sex.
    • Přidej Gastric jako hlavní efekt, ale Sex ne.
    • Přiřaď vzorec do proměnné fmla_interaction a vypiš ho.
  • Natrénuj lineární model pouze s hlavními efekty: model_add na datech.
  • Natrénuj lineární model s interakcí: model_interaction na datech.
  • Zavolej summary() na oba modely. Který z nich má lepší R-squared?