1. Nauka
  2. /
  3. Kursy
  4. /
  5. Podstawy rachunku prawdopodobieństwa w Pythonie

Connected

ćwiczenie

Analiza reszt

Aby zaimplementować model liniowy, trzeba przeanalizować reszty – czyli odległości między przewidywanymi wartościami a rzeczywistymi danymi.

Muszą być spełnione trzy warunki:

  1. Średnia powinna wynosić 0.
  2. Wariancja musi być stała.
  3. Rozkład musi być normalny.

Będziemy pracować z danymi dotyczącymi wyników testów z dwóch szkół – A i B – z tego samego przedmiotu. Modele model_A i model_B zostały dopasowane odpowiednio do danych hours_of_study_A i test_scores_A oraz hours_of_study_B i test_scores_B.

matplotlib.pyplot został zaimportowany jako plt, numpy jako np, a LinearRegression z sklearn.linear_model.

Instrukcje 1/4

undefined XP
  • 1

    Utwórz wykres rozproszenia dla hours_of_study_A i test_scores_A, a następnie narysuj wykres liniowy dla hours_of_study_values_A i wartości przewidywanych przez model_A.

  • 2

    Odejmij wartości przewidywane od test_scores_A, a następnie utwórz wykres rozproszenia dla hours_of_study_A i residuals_A.

  • 3

    Utwórz wykres rozproszenia dla hours_of_study_B i test_scores_B, a następnie narysuj wykres liniowy dla hours_of_study_values_B i wartości przewidywanych przez model_B.

  • 4

    Odejmij wartości przewidywane od test_scores_B, a następnie utwórz wykres rozproszenia dla hours_of_study_B i residuals_B.