1. Uczyć się
  2. /
  3. Courses
  4. /
  5. Obsługa brakujących danych z imputacją w R

Connected

Exercise

Losowanie z rozkładu warunkowego

Samo wywołanie funkcji predict() na modelu zawsze zwróci tę samą wartość dla tych samych wartości predyktorów. Powoduje to małą zmienność w imputowanych danych. Aby ją zwiększyć – tak żeby imputacja odzwierciedlała zmienność z oryginalnych danych – możemy losować z rozkładu warunkowego. Oznacza to, że zamiast zawsze przewidywać 1, gdy model zwraca prawdopodobieństwo większe niż 0,5, losujemy przewidywaną wartość z rozkładu dwumianowego opisanego prawdopodobieństwem zwróconym przez model.

Będziesz pracować na kodzie napisanym w poprzednim ćwiczeniu. Usunięto z niego następującą linię:

  preds <- ifelse(preds >= 0.5, 1, 0)

Twoim zadaniem jest zastąpienie jej losowaniem z rozkładu dwumianowego. To tylko jedna linijka kodu!

Instrukcje

100 XP
  • Nadpisz preds, próbkując z rozkładu dwumianowego.
  • Przekaż długość preds jako pierwszy argument.
  • Ustaw size na 1.
  • Ustaw prob na prawdopodobieństwa zwrócone przez model.