1. 学ぶ
  2. /
  3. コース
  4. /
  5. Wprowadzenie do modelowania liniowego w Pythonie

Connected

演習

Zmienność w dwóch częściach

Masz do dyspozycji dwa zbiory danych przedstawiające zależność odległości od czasu – jeden z bardzo małą prędkością, drugi z dużą. Zauważ, że oba mogą mieć ten sam błąd standardowy nachylenia, ale różne wartości R-kwadrat dla całego modelu, w zależności od wielkości nachylenia ("wielkości efektu") w porównaniu z błędem standardowym ("niepewnością").

Jeśli wykreślisz oba zbiory danych jako wykresy punktowe na tych samych osiach, różnica stanie się wyraźna. Zmienność wynikająca z nachylenia różni się od zmienności spowodowanej losowym rozrzutem wokół linii trendu. Celem tego ćwiczenia jest obliczenie błędu standardowego i R-kwadrat dla obu zbiorów danych oraz ich porównanie.

指示

100 XP
  • Zbuduj i dopasuj (fit()) model ols() dla obu zbiorów danych: distances1 i distances2.
  • Użyj atrybutu .bse wynikowych modeli model_1 i model_2 oraz klucza 'times', aby wyodrębnić wartości błędu standardowego nachylenia z każdego modelu.
  • Użyj atrybutu .rsquared, aby wyodrębnić wartość R-kwadrat z każdego modelu.
  • Wyświetl wynikowe wartości se_1, rsquared_1, se_2, rsquared_2 i porównaj je wzrokowo.