Aan de slagGa gratis aan de slag

Residuen onderzoeken

Om een lineair model te implementeren, moet je de residuen bestuderen: de afstanden tussen de voorspelde uitkomsten en de data.

Er moeten drie voorwaarden gelden:

  1. Het gemiddelde moet 0 zijn.
  2. De variantie moet constant zijn.
  3. De verdeling moet normaal zijn.

We werken met toetscijfers voor twee scholen, A en B, voor hetzelfde vak. model_A en model_B zijn getraind met respectievelijk hours_of_study_A en test_scores_A, en hours_of_study_B en test_scores_B.

matplotlib.pyplot is geïmporteerd als plt, numpy als np en LinearRegression uit sklearn.linear_model.

Deze oefening maakt deel uit van de cursus

Basis van kansrekening in Python

Cursus bekijken

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Scatterplot of hours of study and test scores
plt.scatter(____, ____)

# Plot of hours_of_study_values_A and predicted values
plt.plot(____, model_A.____(hours_of_study_values_A))
plt.title("Model A", fontsize=25)
plt.show()
Code bewerken en uitvoeren