LoslegenKostenlos loslegen

Lineare Regression auf passenden Anscombe-Daten

Übe, indem du eine lineare Regression auf dem Datensatz aus Anscombes Quartett durchführst, der sich am sinnvollsten linear interpretieren lässt.

Diese Übung ist Teil des Kurses

Statistical Thinking in Python (Teil 2)

Kurs anzeigen

Anleitung zur Übung

  • Berechne die Parameter für Steigung und Achsenabschnitt mit np.polyfit(). Die Anscombe-Daten liegen in den Arrays x und y.
  • Gib die Steigung a und den Achsenabschnitt b aus.
  • Erzeuge theoretische \(x\)- und \(y\)-Daten aus der linearen Regression. Dein \(x\)-Array, das du mit np.array() erstellen kannst, soll aus 3 und 15 bestehen. Um die \(y\)-Daten zu erzeugen, multipliziere die Steigung mit x_theor und addiere den Achsenabschnitt.
  • Stelle die Anscombe-Daten als Streudiagramm dar und zeichne anschließend die theoretische Linie. Denk daran, beim Streudiagramm zusätzlich zu x und y die Keyword-Argumente marker='.' und linestyle='none' zu setzen. Für die theoretische Linie brauchst du diese Argumente nicht.
  • Klicke auf Antwort senden, um das Diagramm zu sehen!

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Perform linear regression: a, b
a, b = ____

# Print the slope and intercept
print(____, ____)

# Generate theoretical x and y data: x_theor, y_theor
x_theor = np.array([____, ____])
y_theor = ____ * ____ + ____

# Plot the Anscombe data and theoretical line
_ = ____
_ = ____

# Label the axes
plt.xlabel('x')
plt.ylabel('y')

# Show the plot
plt.show()
Code bearbeiten und ausführen