Residuen onderzoeken
Om een lineair model te implementeren, moet je de residuen bestuderen: de afstanden tussen de voorspelde uitkomsten en de data.
Er moeten drie voorwaarden gelden:
- Het gemiddelde moet 0 zijn.
- De variantie moet constant zijn.
- De verdeling moet normaal zijn.
We werken met toetscijfers voor twee scholen, A en B, voor hetzelfde vak. model_A en model_B zijn getraind met respectievelijk hours_of_study_A en test_scores_A, en hours_of_study_B en test_scores_B.
matplotlib.pyplot is geïmporteerd als plt, numpy als np en LinearRegression uit sklearn.linear_model.
Deze oefening maakt deel uit van de cursus
Basis van kansrekening in Python
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Scatterplot of hours of study and test scores
plt.scatter(____, ____)
# Plot of hours_of_study_values_A and predicted values
plt.plot(____, model_A.____(hours_of_study_values_A))
plt.title("Model A", fontsize=25)
plt.show()