Lineare Regression auf passenden Anscombe-Daten
Übe, indem du eine lineare Regression auf dem Datensatz aus Anscombes Quartett durchführst, der sich am sinnvollsten linear interpretieren lässt.
Diese Übung ist Teil des Kurses
<Kurs>Statistical Thinking in Python (Teil 2)</Kurs>Übungsanweisungen
- Berechne die Parameter für Steigung und Achsenabschnitt mit
np.polyfit(). Die Anscombe-Daten liegen in den Arraysxundy. - Gib die Steigung
aund den Achsenabschnittbaus. - Erzeuge theoretische \(x\)- und \(y\)-Daten aus der linearen Regression. Dein \(x\)-Array, das du mit
np.array()erstellen kannst, soll aus3und15bestehen. Um die \(y\)-Daten zu erzeugen, multipliziere die Steigung mitx_theorund addiere den Achsenabschnitt. - Stelle die Anscombe-Daten als Streudiagramm dar und zeichne anschließend die theoretische Linie. Denk daran, beim Streudiagramm zusätzlich zu
xundydie Keyword-Argumentemarker='.'undlinestyle='none'zu setzen. Für die theoretische Linie brauchst du diese Argumente nicht. - Klicke auf Antwort senden, um das Diagramm zu sehen!
Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Perform linear regression: a, b
a, b = ____
# Print the slope and intercept
print(____, ____)
# Generate theoretical x and y data: x_theor, y_theor
x_theor = np.array([____, ____])
y_theor = ____ * ____ + ____
# Plot the Anscombe data and theoretical line
_ = ____
_ = ____
# Label the axes
plt.xlabel('x')
plt.ylabel('y')
# Show the plot
plt.show()