1. Learn
  2. /
  3. Courses
  4. /
  5. Wprowadzenie do modelowania liniowego w Pythonie

Connected

Exercise

R-kwadrat

Wcześniej poznałeś inną miarę jakości dopasowania – R-kwadrat – wyrażoną jako stosunek RSS do VAR. Po pomnożeniu licznika i mianownika przez 1/n można go interpretować jako stosunek wariancji reszt do wariancji liniowego trendu w modelowanych danych. Innymi słowy, R-kwadrat mówi, jaka część zmienności danych jest „wyjaśniana" przez model, w porównaniu z rozrzutem reszt (czyli tym, co pozostaje po usunięciu trendu liniowego).

Dane x_data, y_data oraz przewidywania modelu y_model dla najlepszego dopasowania zostały już wczytane. Twoim zadaniem jest obliczenie miary R-kwadrat i sprawdzenie, jak dobrze model liniowy opisuje zmienność danych.

Instructions

100 XP
  • Oblicz residuals (reszty), odejmując y_data od y_model, oraz deviations (odchylenia), odejmując y_data od np.mean() wartości y_data.
  • Oblicz wariancję residuals i wariancję deviations, korzystając z funkcji np.mean() i np.square().
  • Oblicz r_squared jako 1 minus stosunek var_residuals / var_deviations i wyświetl wynik.