1. Nauka
  2. /
  3. Kursy
  4. /
  5. Praca z brakującymi danymi w R

Connected

ćwiczenie

Ocena imputacji: wiele zmiennych naraz

Do tej pory omawialiśmy sposoby analizowania pojedynczych zmiennych lub par zmiennych wraz z ich zaimputowanymi wartościami. Czasem jednak chcesz przyjrzeć się imputacjom dla wielu zmiennych jednocześnie. Wymaga to odpowiedniego przekształcenia i reorganizacji danych. Ta lekcja pokazuje, jak wykonać takie przekształcenia – które w przypadku danych w formacie nabular mogą być nieco skomplikowane. Funkcja shadow_long() pozwala nadać danym właściwą postać potrzebną do tego rodzaju wizualizacji.

Instrukcje

100 XP
  • Użyj funkcji shadow_long(), aby zebrać zaimputowane dane z ocean_imp_mean, skupiając się na zmiennych humidity i air_temp_c.
  • Wyświetl dane i przejrzyj je.
  • Zbadaj imputacje na histogramie za pomocą geom_histogram(), umieszczając wartości na osi x, wypełniając kolorem według obecności braków danych i dzieląc wykres na panele według zmiennej variable.