Obliczanie predykcji

W praktyce często chcemy wykorzystać dopasowaną regresję logistyczną do szacowania prawdopodobieństw i wyznaczania przedziałów ufności dla tych oszacowań. Korzystając ze zbioru danych wells i modelu 'switch ~ arsenic', przyjmijmy, że masz nowe obserwacje wells_test, które nie były częścią próby treningowej, i chcesz przewidzieć prawdopodobieństwo przejścia na najbliższe bezpieczne ujęcie wody.

Zrobisz to za pomocą metody .predict().

Zwróć uwagę, że .predict() przyjmuje kilka argumentów:

exog – nowe obserwacje (zbiór testowy)
transform = True – przekazuje formułę dopasowania y ~ x do danych.

Jeśli exog nie zostanie zdefiniowany, prawdopodobieństwa są obliczane dla zbioru treningowego.

Model wells_fit oraz zbiory danych wells i wells_test są wstępnie załadowane w środowisku pracy.

Korzystając z dopasowanego modelu wells_fit, oblicz predykcje na danych testowych wells_test i zapisz wynik jako prediction.
Dodaj prediction do istniejącej ramki danych wells_test i nadaj kolumnie nazwę prediction.
Za pomocą print() wyświetl pierwsze 5 wierszy wells_test z kolumnami switch, arsenic i prediction. Użyj funkcji pandas head(), aby pokazać tylko pierwsze 5 wierszy.

ćwiczenie

Obliczanie predykcji

Instrukcje

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}ćwiczenie

Instrukcje

ćwiczenie