Visualiseer model fit met regplot()
Na het fitten en analyseren van het model kunnen we het visualiseren door de observatiepunten en de gefitte logistische regressie te plotten.
Met de plot kun je visueel begrijpen hoe de verklarende variabele samenhangt met de respons over het bereik van de waarden van de verklarende variabele.
Hiervoor kunnen we de functie regplot() uit de module seaborn gebruiken. De functie regplot() heeft een argument logistic, waarmee je kunt aangeven of je het logistische regressiemodel voor de gegeven data wilt schatten met True of False. Dit levert ook meteen de plot van de fit op.
Onthoud dat het model dat je eerder hebt gefit was:
$$
\log\bigg(\frac{y}{1-y}\bigg) = -0.3055 + 0.3791*\text{arsenic}
$$
De gegevensset wells is al in je werkruimte geladen.
Deze oefening maakt deel uit van de cursus
Generalized Linear Models in Python
Oefeninstructies
- Gebruik de data
wellsomarsenicop de x-as enswitchop de y-as te plotten. - Pas
y_jittervan 0.03 toe om de responswaarden te spreiden voor betere visualisatie. - Gebruik
Truevoor het argumentlogisticzodat de logistische functie over de data wordt gelegd, en zet het argument voor betrouwbaarheidsintervallenciopNoneom geen interval te tonen en de berekening te versnellen. - Toon de plot met
plt.show().
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Plot arsenic and switch and add overlay with the logistic fit
sns.regplot(x = ____, y = ____,
y_jitter = ____,
data = ____,
logistic = ____,
ci = ____)
# Display the plot
____