LoslegenKostenlos loslegen

Bootstrap-Regressionen plotten

Eine schöne Möglichkeit, die erwartete Variabilität in einer linearen Regression zu visualisieren, ist, die Linie zu zeichnen, die du aus jedem Bootstrap-Replikat von Steigung und Achsenabschnitt erhältst. Mach das für die ersten 100 deiner Bootstrap-Replikate von Steigung und Achsenabschnitt (gespeichert als bs_slope_reps und bs_intercept_reps).

Diese Übung ist Teil des Kurses

Statistical Thinking in Python (Teil 2)

Kurs anzeigen

Anleitung zur Übung

  • Erzeuge für das Plotten der Regressionslinien ein Array von \(x\)-Werten bestehend aus 0 und 100. Verwende dazu die Funktion np.array().
  • Schreibe eine for-Schleife, in der du eine Regressionslinie mit einer Steigung und einem Achsenabschnitt plottest, die durch die Paare der Bootstrap-Replikate vorgegeben sind. Mach das für 100 Linien.
    • Beim Plotten der Regressionslinien in jeder Iteration der for-Schleife erinnere dich an die Regressionsgleichung y = a*x + b. Hier ist a bs_slope_reps[i] und b bs_intercept_reps[i].
    • Gib in deinem Aufruf von plt.plot() die Keyword-Argumente linewidth=0.5, alpha=0.2 und color='red' an.
  • Erstelle ein Streudiagramm mit illiteracy auf der x-Achse und fertility auf der y-Achse. Denk daran, die Keyword-Argumente marker='.' und linestyle='none' anzugeben.
  • Beschrifte die Achsen, setze einen Rand von 2 % und zeige den Plot an. Das ist bereits für dich erledigt – klicke also auf Antwort senden, um die Bootstrap-Regressionen zu visualisieren!

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Generate array of x-values for bootstrap lines: x
x = ____

# Plot the bootstrap lines
for i in range(____):
    _ = plt.plot(____, 
                 ____*x + ____,
                 ____=0.5, ____=0.2, ____='red')

# Plot the data
_ = ____

# Label axes, set the margins, and show the plot
_ = plt.xlabel('illiteracy')
_ = plt.ylabel('fertility')
plt.margins(0.02)
plt.show()
Code bearbeiten und ausführen