Bootstrapregressies plotten
Een fijne manier om de variatie te visualiseren die je bij een lineaire regressie kunt verwachten, is door de lijn te plotten die je krijgt uit elke bootstrap-replica van de helling en het snijpunt. Doe dit voor de eerste 100 bootstrap-replica’s van de helling en het snijpunt (opgeslagen als bs_slope_reps en bs_intercept_reps).
Deze oefening maakt deel uit van de cursus
Statistical Thinking in Python (deel 2)
Oefeninstructies
- Genereer een array van \(x\)-waarden die bestaat uit
0en100voor de plot van de regressielijnen. Gebruik hiervoor de functienp.array(). - Schrijf een
for-lus waarin je een regressielijn plot met een helling en snijpunt gegeven door de pairs bootstrap-replica’s. Doe dit voor100lijnen.- Denk bij het plotten van de regressielijnen in elke iteratie van de
for-lus aan de regressievergelijkingy = a*x + b. Hier isabs_slope_reps[i]enbbs_intercept_reps[i]. - Geef de keyword-argumenten
linewidth=0.5,alpha=0.2encolor='red'op in je aanroep vanplt.plot().
- Denk bij het plotten van de regressielijnen in elke iteratie van de
- Maak een spreidingsplot met
illiteracyop de x-as enfertilityop de y-as. Denk eraan de keyword-argumentenmarker='.'enlinestyle='none'te specificeren. - Label de assen, stel een marge van 2% in, en toon de plot. Dit is al voor je gedaan, dus klik op Antwoord verzenden om de bootstrapregressies te visualiseren!
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Generate array of x-values for bootstrap lines: x
x = ____
# Plot the bootstrap lines
for i in range(____):
_ = plt.plot(____,
____*x + ____,
____=0.5, ____=0.2, ____='red')
# Plot the data
_ = ____
# Label axes, set the margins, and show the plot
_ = plt.xlabel('illiteracy')
_ = plt.ylabel('fertility')
plt.margins(0.02)
plt.show()