1. Uczyć się
  2. /
  3. Courses
  4. /
  5. Obsługa brakujących danych z imputacją w R

Connected

Exercise

Imputacja modelowa przy różnych typach zmiennych

Świetna robota z napisaniem funkcji do imputacji metodą regresji logistycznej z losowaniem z rozkładu warunkowego – to naprawdę zaawansowana statystyka! W tym ćwiczeniu połączysz wszystko, czego do tej pory nauczyłeś się o imputacji modelowej, aby uzupełnić braki w różnych typach zmiennych w zbiorze danych tao.

Twoim zadaniem jest iterowanie po zmiennych – tak jak w poprzednim rozdziale – i imputacja dwóch zmiennych:

  • is_hot – nowa zmienna binarna utworzona na podstawie air_temp, przyjmująca wartość 1, gdy air_temp wynosi co najmniej 26 stopni, i 0 w przeciwnym razie;
  • humidity – zmienna ciągła, którą już znasz.

Będziesz musiał użyć poznanej wcześniej funkcji regresji liniowej, a także własnej funkcji do regresji logistycznej. Do dzieła!

Instrukcje

100 XP
  • Ustaw is_hot na NA w miejscach, gdzie pierwotnie brakowało wartości.
  • Dokonaj imputacji is_hot za pomocą regresji logistycznej, używając sea_surface_temp jako jedynego predyktora; skorzystaj ze swojej funkcji impute_logreg().
  • Ustaw humidity na NA w miejscach, gdzie pierwotnie brakowało wartości.
  • Dokonaj imputacji humidity za pomocą regresji liniowej, używając sea_surface_temp i air_temp jako predyktorów.