Lineare Regression auf passenden Anscombe-Daten
Übe, indem du eine lineare Regression auf dem Datensatz aus Anscombes Quartett durchführst, der sich am sinnvollsten linear interpretieren lässt.
Diese Übung ist Teil des Kurses
Statistical Thinking in Python (Teil 2)
Anleitung zur Übung
- Berechne die Parameter für Steigung und Achsenabschnitt mit
np.polyfit(). Die Anscombe-Daten liegen in den Arraysxundy. - Gib die Steigung
aund den Achsenabschnittbaus. - Erzeuge theoretische \(x\)- und \(y\)-Daten aus der linearen Regression. Dein \(x\)-Array, das du mit
np.array()erstellen kannst, soll aus3und15bestehen. Um die \(y\)-Daten zu erzeugen, multipliziere die Steigung mitx_theorund addiere den Achsenabschnitt. - Stelle die Anscombe-Daten als Streudiagramm dar und zeichne anschließend die theoretische Linie. Denk daran, beim Streudiagramm zusätzlich zu
xundydie Keyword-Argumentemarker='.'undlinestyle='none'zu setzen. Für die theoretische Linie brauchst du diese Argumente nicht. - Klicke auf Antwort senden, um das Diagramm zu sehen!
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Perform linear regression: a, b
a, b = ____
# Print the slope and intercept
print(____, ____)
# Generate theoretical x and y data: x_theor, y_theor
x_theor = np.array([____, ____])
y_theor = ____ * ____ + ____
# Plot the Anscombe data and theoretical line
_ = ____
_ = ____
# Label the axes
plt.xlabel('x')
plt.ylabel('y')
# Show the plot
plt.show()