LoslegenKostenlos starten

Lineare Regression auf passenden Anscombe-Daten

Übe, indem du eine lineare Regression auf dem Datensatz aus Anscombes Quartett durchführst, der sich am sinnvollsten linear interpretieren lässt.

Diese Übung ist Teil des Kurses

<Kurs>Statistical Thinking in Python (Teil 2)</Kurs>
Kurs ansehen

Übungsanweisungen

  • Berechne die Parameter für Steigung und Achsenabschnitt mit np.polyfit(). Die Anscombe-Daten liegen in den Arrays x und y.
  • Gib die Steigung a und den Achsenabschnitt b aus.
  • Erzeuge theoretische \(x\)- und \(y\)-Daten aus der linearen Regression. Dein \(x\)-Array, das du mit np.array() erstellen kannst, soll aus 3 und 15 bestehen. Um die \(y\)-Daten zu erzeugen, multipliziere die Steigung mit x_theor und addiere den Achsenabschnitt.
  • Stelle die Anscombe-Daten als Streudiagramm dar und zeichne anschließend die theoretische Linie. Denk daran, beim Streudiagramm zusätzlich zu x und y die Keyword-Argumente marker='.' und linestyle='none' zu setzen. Für die theoretische Linie brauchst du diese Argumente nicht.
  • Klicke auf Antwort senden, um das Diagramm zu sehen!

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Perform linear regression: a, b
a, b = ____

# Print the slope and intercept
print(____, ____)

# Generate theoretical x and y data: x_theor, y_theor
x_theor = np.array([____, ____])
y_theor = ____ * ____ + ____

# Plot the Anscombe data and theoretical line
_ = ____
_ = ____

# Label the axes
plt.xlabel('x')
plt.ylabel('y')

# Show the plot
plt.show()
Code bearbeiten und ausführen