1. Nauka
  2. /
  3. Projekty
  4. /
  5. Studium przypadku: eksploracyjna analiza danych w R

Connected

ćwiczenie

Regresja liniowa na każdym zagnieżdżonym zbiorze danych

Teraz, gdy dane dla każdego kraju zostały podzielone na osobne zbiory danych w kolumnie data, musisz dopasować model liniowy do każdego z nich.

Funkcja map() z pakietu purrr działa poprzez zastosowanie formuły do każdego elementu listy, gdzie . reprezentuje pojedynczy element. Na przykład, aby dodać jeden do każdej liczby na liście:

map(numbers, ~ 1 + .)

Oznacza to, że aby dopasować model do każdego zbioru danych, możesz napisać:

map(data, ~ lm(percent_yes ~ year, data = .))

gdzie . reprezentuje każdy pojedynczy element z kolumny data w by_year_country. Pamiętaj, że każdy element w kolumnie data to zbiór danych dotyczący konkretnego kraju.

Instrukcje

100 XP
  • Wczytaj pakiety tidyr i purrr.
  • Po zagnieżdżeniu danych użyj funkcji map() wewnątrz mutate(), aby przeprowadzić regresję liniową na każdym zbiorze danych (czyli na każdym elemencie kolumny data w by_year_country), modelując percent_yes jako funkcję year. Zapisz wyniki w kolumnie model.