1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Úvod do lineárního modelování v Pythonu

Connected

cvičení

R-squared

Dříve jsme si ukázali jiný způsob měření kvality modelu — R-squared — vyjádřený jako poměr RSS k VAR. Pokud čitatele i jmenovatele tohoto poměru vynásobíme 1/n, dostaneme numericky ekvivalentní formu: poměr rozptylu reziduí k rozptylu lineárního trendu v datech, která modelujeme. To lze interpretovat jako míru toho, kolik z celkové variability dat tvůj model „vysvětluje" — v kontrastu s rozptylem reziduí (tedy co zbude po odstranění lineárního trendu).

Data x_data, y_data a predikce modelu y_model pro nejlépe přiléhající přímku jsou již načtena. Tvým úkolem je vypočítat hodnotu R-squared a zjistit, jak dobře tento lineární model zachycuje variabilitu dat.

Pokyny

100 XP
  • Vypočítej residuals odečtením y_data od y_model a deviations odečtením y_data od průměru y_data pomocí np.mean().
  • Vypočítej rozptyl residuals a rozptyl deviations — použij přitom funkce np.mean() a np.square().
  • Vypočítej r_squared jako 1 minus poměr var_residuals / var_deviations a výsledek vypiš.