1. Nauka
  2. /
  3. Kursy
  4. /
  5. Uogólnione modele liniowe w Pythonie

Connected

ćwiczenie

Obliczanie predykcji

W praktyce często chcemy wykorzystać dopasowaną regresję logistyczną do szacowania prawdopodobieństw i wyznaczania przedziałów ufności dla tych oszacowań. Korzystając ze zbioru danych wells i modelu 'switch ~ arsenic', przyjmijmy, że masz nowe obserwacje wells_test, które nie były częścią próby treningowej, i chcesz przewidzieć prawdopodobieństwo przejścia na najbliższe bezpieczne ujęcie wody.

Zrobisz to za pomocą metody .predict().

Zwróć uwagę, że .predict() przyjmuje kilka argumentów:

  • exog – nowe obserwacje (zbiór testowy)
  • transform = True – przekazuje formułę dopasowania y ~ x do danych.

Jeśli exog nie zostanie zdefiniowany, prawdopodobieństwa są obliczane dla zbioru treningowego.

Model wells_fit oraz zbiory danych wells i wells_test są wstępnie załadowane w środowisku pracy.

Instrukcje

100 XP
  • Korzystając z dopasowanego modelu wells_fit, oblicz predykcje na danych testowych wells_test i zapisz wynik jako prediction.
  • Dodaj prediction do istniejącej ramki danych wells_test i nadaj kolumnie nazwę prediction.
  • Za pomocą print() wyświetl pierwsze 5 wierszy wells_test z kolumnami switch, arsenic i prediction. Użyj funkcji pandas head(), aby pokazać tylko pierwsze 5 wierszy.