1. Learn
  2. /
  3. कोर्स
  4. /
  5. Praca z brakującymi danymi w R

Connected

अभ्यास

Imputacja danych z użyciem pakietu simputation

W R istnieje wiele pakietów do imputacji. Skupimy się na pakiecie simputation, który oferuje prosty i wydajny interfejs do przeprowadzania imputacji.

Budowanie dobrego modelu imputacji jest niezwykle ważne, ale to złożone zagadnienie – wymaga tyle samo uwagi co budowanie dobrego modelu statystycznego. W tym kursie skupimy się na tym, jak oceniać wyniki imputacji.

Na początek przyjrzymy się funkcji impute_lm(), która imputuje wartości zgodnie z określonym modelem liniowym.

W tym ćwiczeniu zastosujesz wcześniej poznane techniki oceny do danych z użyciem impute_lm(), a następnie w kolejnych lekcjach rozbudujesz tę metodę imputacji.

निर्देश

100 XP

Korzystając ze zbioru danych oceanbuoys:

  • Dokonaj imputacji zmiennej humidity przy użyciu zmiennych wind_ew i wind_ns, a brakujące wartości śledź za pomocą add_label_shadow().
  • Zwizualizuj imputowane wartości dla air_temp_c i humidity, umieszczając je odpowiednio na osi x i y, a kolory przypisz według any_missing().