Aan de slagGa gratis aan de slag

Visualiseer model fit met regplot()

Na het fitten en analyseren van het model kunnen we het visualiseren door de observatiepunten en de gefitte logistische regressie te plotten.

Met de plot kun je visueel begrijpen hoe de verklarende variabele samenhangt met de respons over het bereik van de waarden van de verklarende variabele.

Hiervoor kunnen we de functie regplot() uit de module seaborn gebruiken. De functie regplot() heeft een argument logistic, waarmee je kunt aangeven of je het logistische regressiemodel voor de gegeven data wilt schatten met True of False. Dit levert ook meteen de plot van de fit op.

Onthoud dat het model dat je eerder hebt gefit was:
$$ \log\bigg(\frac{y}{1-y}\bigg) = -0.3055 + 0.3791*\text{arsenic} $$

De gegevensset wells is al in je werkruimte geladen.

Deze oefening maakt deel uit van de cursus

Generalized Linear Models in Python

Cursus bekijken

Oefeninstructies

  • Gebruik de data wells om arsenic op de x-as en switch op de y-as te plotten.
  • Pas y_jitter van 0.03 toe om de responswaarden te spreiden voor betere visualisatie.
  • Gebruik True voor het argument logistic zodat de logistische functie over de data wordt gelegd, en zet het argument voor betrouwbaarheidsintervallen ci op None om geen interval te tonen en de berekening te versnellen.
  • Toon de plot met plt.show().

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Plot arsenic and switch and add overlay with the logistic fit
sns.regplot(x = ____, y = ____, 
            y_jitter = ____,
            data = ____, 
            logistic = ____,
            ci = ____)

# Display the plot
____
Code bewerken en uitvoeren