1. Uczyć się
  2. /
  3. Courses
  4. /
  5. Obsługa brakujących danych z imputacją w R

Connected

Exercise

Wyczuwanie zagrożeń związanych z imputacją średnią

Jedną z najpopularniejszych metod imputacji jest imputacja średnią, w której brakujące wartości w zmiennej zastępuje się średnią z wartości obserwowanych w tej zmiennej. W wielu przypadkach to proste podejście jest jednak złym wyborem. Czasem szybkie spojrzenie na dane wystarczy, by dostrzec zagrożenia związane z imputacją średnią.

W tym rozdziale będziesz pracować z próbką danych projektu Tropical Atmosphere Ocean (tao). Zbiór danych zawiera pomiary atmosferyczne wykonane w dwóch różnych okresach czasu w pięciu różnych lokalizacjach. Dane pochodzą z pakietu VIM.

W tym ćwiczeniu zapoznasz się z danymi i przeprowadzisz prostą analizę, która wskaże, jakie konsekwencje może mieć imputacja średnią. Przyjrzyjmy się danym tao!

Instrukcje 1 / 3

undefined XP
    1
    2
    3
  • Wyświetl pierwsze 10 wierszy danych tao i zapoznaj się ze zmiennymi.