1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Zobecněné lineární modely v Pythonu

Connected

Bài tập

Koeficienty vyjádřené jako poměr šancí

V předchozím cvičení jsi sestavil/a model logistické regrese pro pravděpodobnost přepojení studny v závislosti na hladinách arsenic. V tomto cvičení se podíváš na to, jak se k pravděpodobnosti přepojení vztahuje proměnná distance100, a naučíš se interpretovat hodnoty koeficientů jako poměr šancí.

Vzpomeň si, že model logistické regrese pracuje s logaritmem šancí (log odds). Chceš-li zjistit, kolikrát se šance změní při jednotkovém nárůstu x, stačí exponenciovat odhady koeficientů. Tato hodnota se nazývá poměr šancí (odds ratio).

Šance je poměr pravděpodobnosti, že nastane daná událost, k pravděpodobnosti, že nenastane. Například šance 1/2 neboli 1 ku 2 (1:2) znamená, že na každou výhru připadají 2 prohry.

Dataset wells je načtený v pracovním prostředí.

Hướng dẫn

100 XP
  • Importuj knihovnu statsmodels a funkci glm z statsmodels.formula.api. Také importuj numpy jako np.
  • Pomocí glm() fituj model logistické regrese, kde je proměnná switch předpovídána proměnnou distance100.
  • Extrahuj koeficienty modelu pomocí .params.
  • Vypočítej multiplikativní vliv na šance pomocí funkce exp() z knihovny numpy.