Aan de slagGa gratis aan de slag

Bootstrapregressies plotten

Een fijne manier om de variatie te visualiseren die je bij een lineaire regressie kunt verwachten, is door de lijn te plotten die je krijgt uit elke bootstrap-replica van de helling en het snijpunt. Doe dit voor de eerste 100 bootstrap-replica’s van de helling en het snijpunt (opgeslagen als bs_slope_reps en bs_intercept_reps).

Deze oefening maakt deel uit van de cursus

Statistical Thinking in Python (deel 2)

Cursus bekijken

Oefeninstructies

  • Genereer een array van \(x\)-waarden die bestaat uit 0 en 100 voor de plot van de regressielijnen. Gebruik hiervoor de functie np.array().
  • Schrijf een for-lus waarin je een regressielijn plot met een helling en snijpunt gegeven door de pairs bootstrap-replica’s. Doe dit voor 100 lijnen.
    • Denk bij het plotten van de regressielijnen in elke iteratie van de for-lus aan de regressievergelijking y = a*x + b. Hier is a bs_slope_reps[i] en b bs_intercept_reps[i].
    • Geef de keyword-argumenten linewidth=0.5, alpha=0.2 en color='red' op in je aanroep van plt.plot().
  • Maak een spreidingsplot met illiteracy op de x-as en fertility op de y-as. Denk eraan de keyword-argumenten marker='.' en linestyle='none' te specificeren.
  • Label de assen, stel een marge van 2% in, en toon de plot. Dit is al voor je gedaan, dus klik op Antwoord verzenden om de bootstrapregressies te visualiseren!

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Generate array of x-values for bootstrap lines: x
x = ____

# Plot the bootstrap lines
for i in range(____):
    _ = plt.plot(____, 
                 ____*x + ____,
                 ____=0.5, ____=0.2, ____='red')

# Plot the data
_ = ____

# Label axes, set the margins, and show the plot
_ = plt.xlabel('illiteracy')
_ = plt.ylabel('fertility')
plt.margins(0.02)
plt.show()
Code bewerken en uitvoeren