1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Supervised Learning in R: Regression

Connected

Cvičení

Předpověď přežití vrabců

V tomto cvičení budeš předpovídat pravděpodobnost přežití pomocí modelu přežití vrabců z předchozího cvičení.

Pamatuj, že při volání funkce predict() (docs) pro získání předpovězených pravděpodobností z modelu glm() musíš explicitně zadat, že chceš odpověď (response):

predict(model, type = "response")

Pokud to neuděláš, funkce predict() na modelu logistické regrese vrátí předpovězené log-odds události, nikoli pravděpodobnost.

Použiješ také funkci GainCurvePlot() (docs) pro vykreslení gain křivky z predikcí modelu. Pokud se gain křivka modelu blíží ideální ("wizard") gain křivce, model vrabce dobře seřadil – tedy předpověděl, že vrabci, kteří skutečně přežili, budou mít vyšší pravděpodobnost přežití. Argumenty funkce GainCurvePlot() jsou:

  • frame: datový rámec se sloupcem predikcí a sloupcem skutečných hodnot
  • xvar: název sloupce s predikcemi (jako řetězec)
  • truthVar: název sloupce se skutečnými výsledky (jako řetězec)
  • title: název grafu (jako řetězec)

GainCurvePlot(frame, xvar, truthVar, title)

Dataový rámec sparrow a model sparrow_model jsou předem načteny.

Pokyny

100 XP
  • Vytvoř v datovém rámci sparrow nový sloupec pred s predikcemi na trénovacích datech.
  • Zavolej GainCurvePlot() a vykresli gain křivku predikcí. Odvádí model dobrou práci při řazení vrabců podle toho, zda skutečně přežili?