1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Základy pravděpodobnosti v Pythonu

Connected

cvičení

Studium reziduálů

Při implementaci lineárního modelu je potřeba prostudovat reziduály – tedy vzdálenosti mezi předpovězenými hodnotami a skutečnými daty.

Musí být splněny tři podmínky:

  1. Střední hodnota musí být 0.
  2. Rozptyl musí být konstantní.
  3. Rozdělení musí být normální.

Budeme pracovat s daty výsledků testů ze dvou škol, A a B, ze stejného předmětu. model_A a model_B byly natrenovány na datech hours_of_study_A a test_scores_A, resp. hours_of_study_B a test_scores_B.

matplotlib.pyplot byl importován jako plt, numpy jako np a LinearRegression z sklearn.linear_model.

Instrukce 1/4

undefined XP
  • 1

    Vytvoř bodový graf hodnot hours_of_study_A a test_scores_A a vykresli hours_of_study_values_A spolu s předpovědmi z model_A.

  • 2

    Odečti předpovězené hodnoty od test_scores_A a vytvoř bodový graf s hours_of_study_A a residuals_A.

  • 3

    Vytvoř bodový graf hodnot hours_of_study_B a test_scores_B a vykresli hours_of_study_values_B spolu s předpovědmi z model_B.

  • 4

    Odečti předpovězené hodnoty od test_scores_B a vytvoř bodový graf s hours_of_study_B a residuals_B.