Lineaire regressie op geschikte Anscombe-gegevens
Oefen door een lineaire regressie uit te voeren op de gegevensset uit Anscombe’s kwartet die het best met lineaire regressie te interpreteren is.
Deze oefening maakt deel uit van de cursus
Statistical Thinking in Python (deel 2)
Oefeninstructies
- Bereken de parameters voor de helling en het snijpunt met
np.polyfit(). De Anscombe-gegevens staan in de arraysxeny. - Print de helling
aen het snijpuntb. - Genereer theoretische \(x\)- en \(y\)-gegevens uit de lineaire regressie. Je \(x\)-array, die je kunt maken met
np.array(), moet bestaan uit3en15. Voor de \(y\)-gegevens vermenigvuldig je de helling metx_theoren tel je het snijpunt erbij op. - Plot de Anscombe-gegevens als een scatterplot en plot daarna de theoretische lijn. Vergeet niet de keywordargumenten
marker='.'enlinestyle='none'op te nemen naastxenywanneer je de Anscombe-gegevens als scatterplot plot. Deze argumenten heb je niet nodig bij het plotten van de theoretische lijn. - Klik op Antwoord verzenden om de plot te bekijken!
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Perform linear regression: a, b
a, b = ____
# Print the slope and intercept
print(____, ____)
# Generate theoretical x and y data: x_theor, y_theor
x_theor = np.array([____, ____])
y_theor = ____ * ____ + ____
# Plot the Anscombe data and theoretical line
_ = ____
_ = ____
# Label the axes
plt.xlabel('x')
plt.ylabel('y')
# Show the plot
plt.show()