Aan de slagGa gratis aan de slag

Lineaire regressie op geschikte Anscombe-gegevens

Oefen door een lineaire regressie uit te voeren op de gegevensset uit Anscombe’s kwartet die het best met lineaire regressie te interpreteren is.

Deze oefening maakt deel uit van de cursus

Statistical Thinking in Python (deel 2)

Cursus bekijken

Oefeninstructies

  • Bereken de parameters voor de helling en het snijpunt met np.polyfit(). De Anscombe-gegevens staan in de arrays x en y.
  • Print de helling a en het snijpunt b.
  • Genereer theoretische \(x\)- en \(y\)-gegevens uit de lineaire regressie. Je \(x\)-array, die je kunt maken met np.array(), moet bestaan uit 3 en 15. Voor de \(y\)-gegevens vermenigvuldig je de helling met x_theor en tel je het snijpunt erbij op.
  • Plot de Anscombe-gegevens als een scatterplot en plot daarna de theoretische lijn. Vergeet niet de keywordargumenten marker='.' en linestyle='none' op te nemen naast x en y wanneer je de Anscombe-gegevens als scatterplot plot. Deze argumenten heb je niet nodig bij het plotten van de theoretische lijn.
  • Klik op Antwoord verzenden om de plot te bekijken!

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Perform linear regression: a, b
a, b = ____

# Print the slope and intercept
print(____, ____)

# Generate theoretical x and y data: x_theor, y_theor
x_theor = np.array([____, ____])
y_theor = ____ * ____ + ____

# Plot the Anscombe data and theoretical line
_ = ____
_ = ____

# Label the axes
plt.xlabel('x')
plt.ylabel('y')

# Show the plot
plt.show()
Code bewerken en uitvoeren