1. Uczyć się
  2. /
  3. Courses
  4. /
  5. Obsługa brakujących danych z imputacją w R

Connected

Exercise

Imputacja z użyciem lasów losowych

Podejście do imputacji oparte na uczeniu maszynowym może być zarówno dokładniejsze, jak i prostsze w implementacji niż tradycyjne modele statystyczne. Po pierwsze, nie wymaga ręcznego określania zależności między zmiennymi. Co więcej, modele uczenia maszynowego, takie jak lasy losowe, potrafią wykrywać złożone, nieliniowe relacje i wykorzystywać je do przewidywania brakujących wartości.

W tym ćwiczeniu poznasz pakiet missForest, który buduje osobny las losowy do przewidywania brakujących wartości dla każdej zmiennej z osobna. Wywołasz funkcję imputacji na zbiorze danych o filmach biograficznych – biopics – z którym pracowałeś wcześniej w kursie, a następnie wyodrębnisz uzupełnione dane oraz szacowane błędy imputacji.

Czas posadzić trochę lasów losowych!

Instrukcje

100 XP
  • Wczytaj pakiet missForest.
  • Użyj funkcji missForest(), aby uzupełnić brakujące wartości w zbiorze danych biopics; przypisz wynik do imp_res.
  • Wyodrębnij uzupełniony zbiór danych z imp_res, przypisz go do imp_data i sprawdź, czy liczba brakujących wartości wynosi rzeczywiście zero.
  • Wyodrębnij szacowany błąd imputacji z imp_res, przypisz go do imp_err i wyświetl w konsoli.