1. Nauka
  2. /
  3. Kursy
  4. /
  5. Praca z brakującymi danymi w R

Connected

ćwiczenie

Imputowanie danych poniżej zakresu z użyciem danych nabular

Ważne jest, żeby śledzić imputowane wartości. Bez tego bardzo trudno ocenić, jak dobre są podstawione wartości.

Przećwiczysz imputowanie danych i odtworzysz wizualizacje z poprzedniego zestawu ćwiczeń, podstawiając wartości poniżej zakresu danych.

To bardzo przydatna technika do dalszego eksplorowania braków danych – stanowi również podstawę imputowania brakujących wartości.

Na początek zaimputujesz dane poniżej zakresu za pomocą impute_below_all(), a następnie zwizualizujesz wyniki. Zauważysz, że choć widać, gdzie znajdują się brakujące wartości, potrzebny jest sposób na ich śledzenie. Pomocny będzie tu schemat programowania „śledź brakujące dane".

Instrukcje

100 XP

Korzystając z danych oceanbuoys:

  • Zaimputuj wartości poniżej zakresu za pomocą impute_below_all().
  • Zwizualizuj nowe brakujące wartości, umieszczając wind_ew na osi x, a air_temp_c na osi y.
  • Zaimputuj i śledź dane, używając bind_shadow(), impute_below_all() oraz add_label_shadow().
  • Wyświetl wykres i przeanalizuj zaimputowane wartości.