1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Úvod do lineárního modelování v Pythonu

Connected

cvičení

Variabilita ve dvou podobách

Máme k dispozici dvě datové sady zachycující závislost vzdálenosti na čase – jedna s velmi malou rychlostí, druhá s velkou rychlostí. Všimni si, že obě mohou mít stejnou standardní chybu směrnice, ale různé hodnoty R-squared pro celý model – záleží na tom, jak velká je směrnice ("velikost efektu") v porovnání se standardní chybou ("míra nejistoty").

Pokud obě datové sady vykreslíme jako bodové grafy na stejné ose, rozdíl je zřejmý. Variabilita způsobená směrnicí se liší od variability způsobené náhodným rozptylem kolem trendové linie. Cílem tohoto cvičení je vypočítat standardní chybu a R-squared pro obě datové sady a porovnat je.

Pokyny

100 XP
  • Sestav a pomocí fit() natrénuj model ols() pro obě datové sady distances1 a distances2.
  • Z výsledných modelů model_1 a model_2 použij atribut .bse a klíč 'times' k získání hodnot standardní chyby směrnice.
  • Pomocí atributu .rsquared získej hodnotu R-squared z každého modelu.
  • Vypiš výsledné hodnoty se_1, rsquared_1, se_2, rsquared_2 a vizuálně je porovnej.