1. Learn
  2. /
  3. Courses
  4. /
  5. Obsługa brakujących danych z imputacją w R

Connected

Exercise

Imputacja metodą regresji liniowej

Czasem można wykorzystać wiedzę dziedzinową, wyniki wcześniejszych badań lub zwykłą intuicję, aby opisać zależności między zmiennymi w zbiorze danych. W takich przypadkach imputacja oparta na modelu to świetne rozwiązanie – pozwala uzupełniać brakujące wartości zgodnie z modelem statystycznym, który sam definiujesz, uwzględniając założenia dotyczące wzajemnego wpływu zmiennych.

Dla zmiennych ciągłych popularnym wyborem jest regresja liniowa. Nie ogranicza cię ona jednak do relacji liniowych! Jako predyktory możesz zawsze uwzględnić kwadrat zmiennej lub jej logarytm. W tym ćwiczeniu użyjesz pakietu simputation, aby przeprowadzić pojedynczą imputację metodą regresji liniowej na danych tao i przeanalizować wyniki. Zaczynajmy!

Instructions 1/4

undefined XP
    1
    2
    3
    4
  • Wczytaj pakiet simputation.
  • Użyj funkcji impute_lm(), aby przeprowadzić imputację metodą regresji liniowej dla zmiennych air_temp i humidity, używając year, latitude i sea_surface_temp jako predyktorów. Wynik przypisz do zmiennej tao_imp.