1. Nauka
  2. /
  3. Kursy
  4. /
  5. Uogólnione modele liniowe w R

Connected

ćwiczenie

Regresja logistyczna – dane w formacie szerokim

Drugie i trzecie podejście do dopasowywania regresji logistycznej wymaga danych w formacie „szerokim":

      x fail success Total successProportion
    1 a   12       2    14         0.1428571
    2 b    3      11    14         0.7857143

W drugim podejściu modelujesz macierz 2-kolumnową zawierającą liczbę sukcesów i porażek (np. liczbę odpowiedzi „nie" i „tak" w każdej grupie).

W tym formacie użyj formuły cbind(success, fail) ~ predictor.

W trzecim podejściu modelujesz prawdopodobieństwo sukcesu (np. w grupie 1 było 75% odpowiedzi „tak", a w grupie 2 – 65% odpowiedzi „nie") oraz wagę, czyli liczbę obserwacji w każdej grupie (np. w grupie 1 było 40 osób, a w grupie 2 – 100 osób). W tym przykładzie successProportion = success / Total.

W tym formacie formuła proportion of successes ~ response variable jest używana z argumentem weights = number in treatment.

Instrukcje 1/2

undefined XP
    1
    2
  • Dopasuj regresję logistyczną, korzystając z ramki danych data_wide. Połącz kolumny success i fail za pomocą cbind(), a następnie użyj ich jako zmiennej zależnej przewidywanej przez x. Zapisz wynik jako lr_2.
  • Wyświetl zawartość obiektu lr_2.