1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Zobecněné lineární modely v Pythonu

Connected

cvičení

Výpočet predikcí

V praxi nás často zajímá využití natrénované logistické regrese k odhadování pravděpodobností a konstrukci intervalů spolehlivosti pro tyto odhady. Pracujeme s datasetem wells a modelem 'switch ~ arsenic'. Představ si, že máš nová pozorování wells_test, která nebyla součástí trénovací sady, a chceš předpovědět pravděpodobnost přechodu k nejbližší bezpečné studni.

K tomu využiješ metodu .predict().

Měj na paměti, že .predict() přijímá několik argumentů:

  • exog – nová pozorování (testovací dataset)
  • transform = True – předá formuli modelu y ~ x datům.

Pokud exog není zadáno, pravděpodobnosti se vypočítají pro trénovací dataset.

Model wells_fit a datasety wells a wells_test jsou v pracovním prostoru předem načteny.

Pokyny

100 XP
  • Pomocí natrénovaného modelu wells_fit vypočítej predikce na testovacích datech wells_test a výsledek ulož jako prediction.
  • Přidej prediction do stávajícího dataframu wells_test a pojmenuj sloupec prediction.
  • Pomocí print() zobraz prvních 5 řádků dataframu wells_test se sloupci switch, arsenic a prediction. K zobrazení pouze prvních 5 řádků použij funkci head() z knihovny pandas.